最新 最热

Hadoop 集群安装

文章目录1. Step8:NameNode format(格式化操作)2. Hadoop集群启动关闭-手动逐个进程启停3. Hadoop集群启动关闭-shell脚本一键启停4. Hadoop集群启动日志5. Hadoop Web UI页面-HDFS集群6. Hadoop Web UI页面-YARN集群1....

2021-06-11
1

Hadoop 集群搭建

https://archive.apache.org/dist/hadoop/common/,这里包含所有发布的版本

2021-06-11
1

MapReduce 概述及核心思想

(1)分布式的运算程序往往需要分成至少 2 个阶段。 (2)第一个阶段的 MapTask 并发实例,完全并行运行,互不相干。 (3)第二个阶段的 ReduceTask 并发实例互不相干,但是他们的数据依赖于上一个阶段 的所有 MapTask 并发实例的输出...

2021-06-11
1

Spark报错:Caused by: java.lang.IllegalArgumentException: Compression codec com.hadoop.compression.lzo

原因: 因为在之前的项目中,在hadoop中的core-site.xml 和mapred-site.xml文件配置了lzo格式的压缩,这就导致上传到hdfs 的文件自动被压缩为lzo了。所以当使用提交spark-submit任务时,需要访问HDFS上的文件,而spark自身没有...

2021-06-11
1

基于Ubuntu 14.04 KVM拟化安装部署

root@linuxidc:~# egrep -o '(vmx | svm)' /proc/cpuinfo

2021-06-10
1

Hadoop 的“遗产”

宣布“Hadoop 已死”已成为一种时尚。但,Hadoop 让企业失去了对大数据的恐惧。Hadoop 反过来又释放出一种创新的良性循环,为我们今天所知的云分析和人工智能服务带来了大量市场。...

2021-06-08
1

从广告监测到知识图谱,明略千亿大数据处理能力是如何炼成的?

网购、叫车、订外卖、看电影...... 移动互联网各种场景的背后都离不开大数据技术。经过十几年的发展,大数据技术已经成为互联网企业的基础设施。

2021-06-08
1

Centos8 安装hadoop 2.7.7(3节点)

本地测试环境想跑点东西,就整个三节点的hadoop2.7.7吧。也跑过3.3.0的版本。本地正好跟着友凡老师的教程做些东西,他的课程都是2.6.0的版本。也不想先升级太快不匹配各种找问题了。就找了个2.7.7的包本地跑一跑了...

2021-06-04
1

HBASE BufferedMutator 批量写入使用举例与源码解析

BufferedMutator主要用来异步批量的将数据写入一个hbase表,就像Htable一样。通过Connection获取一个实例。

2021-06-04
1

硅谷企业的大数据平台架构什么样?看看Twitter、Airbnb、Uber的实践

Twitter是最早一批推进数字化运营的硅谷企业之一,其公司运营和产品迭代的很多功能是由其底层的大数据平台提供的。图7-2所示为Twitter大数据平台的基本示意图。...

2021-06-01
1