最新 最热

漫谈数字经济和个人发展

报告以"迈入数字时代"为始,开启了演讲。[1]追溯数字时代的发展历程可从上世纪四十年代计算机的发明开始,直至今日的大数据时代的到来。期间数字技术从未停止发展的步伐,有别于传统数据处理方案的数据量小,记录不完整,结...

2021-04-09
1

Apache Impala 的安装部署

4.配置本地yum源 4.1.上传安装包解压 使用sftp的方式把安装包大文件上传到服务器/cloudera_data目录下。

2021-04-09
1

MapReduce计数器,Tash的运行机制,shuffle过程,压缩算法

计数器是收集作业统计信息的有效手段之一,用于质量控制或应用级统计。计数器还可辅助诊断系统故障。如果需要将日志信息传输到map 或reduce 任务, 更好的方法通常是看能否用一个计数器值来记录某一特定事件的发生。对于...

2021-04-09
1

解决Windows环境下hadoop集群的运行

需要3个步骤: 1.设置hadoop在windows上的环境(这里我安装的是hadoop-2.7.1)

2021-04-09
1

大数据成长之路-- hadoop集群的部署(4)

在namenod的cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop目录下创建dfs.hosts.exclude文件,并添加需要退役的主机名称 node01执行以下命令

2021-04-09
1

大数据成长之路-- hadoop集群的部署(3)

第六步:node04服务器关机重启并生成公钥与私钥 node04执行以下命令关机重启

2021-04-09
1

大数据成长之路------hadoop集群的部署(2)

7、启动集群 a)格式化集群 在第一个节点执行 hadoop namenode -format

2021-04-09
1

【20】进大厂必须掌握的面试题-50个Hadoop面试

“大数据”是用于收集大型和复杂数据集的术语,这使得很难使用关系数据库管理工具或传统数据处理应用程序进行处理。很难捕获,整理,存储,搜索,共享,传输,分析和可视化大数据。大数据已成为公司的机遇。现在,他们可以成功地从数...

2021-04-07
1

什么是大数据开发?看完我终于懂了......

从大数据开发的工作内容来看大数据开发主要负责大数据的大数据挖掘,数据清洗的发展,数据建模工作。

2021-04-02
1