最新 最热

分布式计算框架MapReduce

MapReduce源自Google的MapReduce论文,论文发表于2004年12月。Hadoop MapReduce可以说是Google MapReduce的一个开源实现。MapReduce优点在于可以将海量的数据进行离线处理,并且MapReduce也易于开发,因为MapReduce框架帮...

2020-09-23
0

Hadoop分布式集群环境搭建

之前我们已经介绍了如何在单机上搭建伪分布式的Hadoop环境,而在实际情况中,肯定都是多机器多节点的分布式集群环境,所以本文将简单介绍一下如何在多台机器上搭建Hadoop的分布式环境。...

2020-09-23
0

(四)Hadoop参数调优

dfs.namenode.handler.count=20 * log2(Cluster Size),比如集群规模为8台时,即20*8的对数,此参数设置为60 The number of Namenode RPC server threads that listen to requests from clients.......

2020-09-23
0

【大数据云原生系列】大数据系统云原生渐进式演进最佳实践

王玉君,腾讯云后台工程师,拥有多年大规模Kubernetes集群的开发运维经验。目前负责腾讯云TKE大规模Kubernetes集群的大数据应用托管服务。 谭春强,腾讯云后台工程师,拥有两年大数据EMR集群管控运维经验,目前负责腾讯云大数...

2020-09-22
0

Hadoop伪分布式搭建(hadoop2.x通用)

如果读者使用的是 ubuntu 或者其他 linux 版本,思路和本文一样,只不过命令略有出入。

2020-09-22
0

Hadoop框架:单服务下伪分布式集群搭建

以下配置文件所在路径:/opt/hadoop2.7/etc/hadoop,这里是Linux环境,脚本配置sh格式。

2020-09-18
0

前端小知识10点(2020.9.13)

② macOS 打开访达—>command+shift+g—>~/Library/Application Support/Code/User/

2020-09-18
0

[未解决]yarn安装报错网络问题解决

报错内容:info There appears to be trouble with your network connection. Retrying...尝试无果:方法一:npm config set registry https://registry.npm.taobao.orgnpm config s...

2020-09-17
0

Hive on Spark参数调优姿势小结

Hive on Spark是指使用Spark替代传统MapReduce作为Hive的执行引擎,在HIVE-7292提出。Hive on Spark的效率比on MR要高不少,但是也需要合理调整参数才能最大化性能,本文简单列举一些调优项。为了符合实际情况,Spark也采用o...

2020-09-16
0

flink实战-实时计算平台通过api停止流任务

今天我们主要讲一下如何通过api的方式来停止一个通过per job模式部署在yarn集群上的任务。

2020-09-15
0