最新 最热

Apache Hadoop 答疑:解决 Apache Hadoop 启动时 DataNode 启动异常的问题

本文用于解决 Apache Hadoop 启动时 DataNode 启动异常的问题,但是请注意这会删除 HDFS 中原有的所有数据,如果原有的数据很重要请不要这样做。

2022-05-08
0

ssh 配置:在 Linux 中 ssh 配置无密码登陆完整步骤以及易错点分析

对于 Hadoop 的伪分布式和全分布式而言,Hadoop 的名称节点(NameNode)需要启动集群中所有机器的 Hadoop 的守护进程,这个过程可以通过 SSH 登陆来实现。Hadoop 并没有提供 SSH 输入密码登陆的形式,因此为了能够顺利登陆每台...

2022-05-08
1

大数据基础系列 4:伪分布式 Hadoop 在 Ubuntu 上的安装流程完整步骤及易错点分析

本文为大数据基础系列 4:伪分布式 Hadoop 在 Ubuntu 上的安装流程完整步骤及易错点分析,以 ubuntu-18.04.3、hadoop-3.2.1-tar.gz 为例。本系列的其他文章可以移步本人大数据专栏进行查看。对于本篇文章,我个人是很有自...

2022-05-08
0

杨校老师课堂之集群内SSH免密登录功能配置

上述查询到的id_rsa就是hadoop1的私钥、id_rsa.pub则是hadoop的公钥

2022-05-07
0

杨校老师课堂之Hadoop环境搭建(二)

当下,在VMWare内浏览器中进行访问web页面(http://hadoop1:50070)来查看Hadoop的信息

2022-05-07
0

杨校老师课堂之Hadoop环境搭建(一)

点我去下载,或访问:http://archive.apache.org/dist/hadoop/common/

2022-05-07
0

tableau桌面版连接spark sql的测试

Tableau是一款优秀的数据可视化分析软件,这几天安装之后,感觉它不仅可以实现对各种数据的可视化绘制操作,并支持多个视图按照故事进行组织,同时具有强大的数据连接操作。支持各种数据源。当然最强大的肯定还是它的server...

2022-05-07
0

Hive 插入数据时遇到Return Code 2问题的解决

Hive运行成功之后,当输入select count(*) from XX或者插入数据时,居然碰到BUG。

2022-05-07
1

Spark访问HBase的Eclipse代码实现

Hbase是一个列式数据库,从其本质上来看,可以当做是一个数据源,而Spark本身又可以进行Hbase的连接,访问数据并进行查询。

2022-05-07
1

Spark Hive在Eclipse代码中直接编译问题

利用Eclipse进行Spark开发过程中,特别是针对Hive开发时,经常会碰到这样一个问题,就是无法找到metastore。而一旦找不到的时候,hive会自动创建一个临时的本地的metastore,其提示INFO信息如下:...

2022-05-07
1