最新 最热

Hive 高频面试题 30 题

来源:大数据技术与架构本文约6000字,建议阅读10分钟本文收集了Hive面试中的高频考题。 如果你是数据开发、数据研发、或数据分析师,那么这篇文章将对你非常有用。记得转发收藏哦。 一、Hive面试题 1、hive内部表和外部表...

2022-04-06
0

用Stream来优化老代码,瞬间干净优雅了!

Java8 的新特性主要是 Lambda 表达式和流,当流和 Lambda 表达式结合起来一起使用时,因为流申明式处理数据集合的特点,可以让代码变得简洁易读。

2022-04-04
0

8个超好用的Python内置函数,提升效率必备!

python中有许多内置函数,不像print那么广为人知,但它们却异常的强大,用好了可以大大提高代码效率。

2022-04-03
0

一文读懂python的map、reduce函数

这对兄弟是出现频率极高且相当实用的python函数,初学者会较难理解,看完本文你就能搞定它们喽!

2022-04-02
0

PNAS最新研究:青藏高原多年冻土退化下活动层土壤的微生物稳定性降低与碳损失紧密关联 | CNGBdb支撑发表科研成果速递

2021年6月15日,中国科学院西北生态环境资源研究院、中国科学院大学资源与环境学院、青岛华大基因研究院等机构的科研团队在美国国家科学院院刊(PNAS)在线发表题为Reduced microbial stability in the active layer is as...

2022-04-01
0

分布式与云计算 单元测验

5单选(2分)每种大数据产品都有特定的应用场景,以下哪个产品是用于批处理的:(A)

2022-04-01
1

MapReduce WordCount 单词计数

实验环境系统版本:Centos 7.5Hadoop版本:Apache Hadoop 2.7.31. 简述Hadoop将输入数据切分成若干个输入分片(input split),并将每个split交给一个MapTask处理;Map Task不断的从对应的split中解析出一个个key/value,并调用m...

2022-04-01
0

YARN

YARN(Yet Another Resource Negotiator),下一代MapReduce框架。该框架已经不再是一个传统的MapReduce框架,是一个通用的运行时框架,用户可以编写自己的计算框架,在该运行环境中运行。...

2022-03-31
1

Hadoop前世今生

本文从Hadoop(1.0)系统中调度策略的角度展开讨论。这本质还是对Hadoop的集群资源进行管理,主要有四个方面:

2022-03-31
1

Hadoop是什么?

Hadoop是使用Java编写,允许分布在集群,使用简单的编程模型的计算机大型数据集处理的Apache的开源框架。Hadoop框架应用工程提供跨计算机集群的分布式存储和计算的环境。Hadoop是专为从单一服务器到上千台机器扩展,每个机...

2022-03-30
0