最新 最热

大数据凉凉了?Apache将一众大数据开源项目束之高阁!

这两天Apache基金会,这个因为大数据而成名的开源基金会连续不断的宣布将一系列的项目束之高阁报废,也就是所谓的进入Apache Attic。这些项目的PMC委员会会解散。...

2021-04-21
1

我的 Hadoop 3.2.2 之旅 【收藏夹吃灰系列】

这样的心情,大学时代更有体会。每次假期回家,总要带回一大包书,告诉自己要奋斗,要看书,结果回校前一夜,发现包里的书,安静如初。如果不赶紧翻出来品上一两页,缓解下心焦,那可耻的厌恶感,总挥之不去。...

2021-04-19
1

席卷全球的大数据发展趋势需要什么?

大数据成为时代发展一个必然的产物,而且大数据正在加速渗透到我们的日常生活中,从衣食住行各个层面均有体现。大数据时代,一切可量化,一切可分析。...

2021-04-16
1

分布式计算框架状态与容错的设计

对于一个分布式计算引擎(尤其是7*24小时不断运行的流处理系统)来说,由于机器故障、数据异常等原因导致作业失败的情况是时常发生的,因此一般的分布式计算引擎如Hadoop、Spark都会设计状态容错机制确保作业失败后能够恢复...

2021-04-16
1

Hive企业级性能优化(好文建议收藏)

Hive作为大数据平台举足轻重的框架,以其稳定性和简单易用性也成为当前构建企业级数据仓库时使用最多的框架之一。

2021-04-15
1

HDSF集群扩容

1、关闭防火墙 2、关闭selinux 3、修改主机名 4、主机名与IP的对应关系 5、SSH免密码登录 6、安装JDK

2021-04-15
1

第一个“国产“Apache顶级项目——Kylin,了解一下!

不熟悉Apache软件基金会的朋友也不用担心,大家可以去Apache官网,下拉到最下边的页面,查看Apache有哪些开源项目。

2021-04-14
1

Flink学习笔记(2) -- Flink部署

https://mirrors.tuna.tsinghua.edu.cn/apache/flink/flink-1.6.1/flink-1.6.1-bin-hadoop27-scala_2.11.tgz

2021-04-13
1

Hive第一篇详细介绍(小白也看得懂_入门级别)

​ Hive是一个语句Hadoop的一个数据仓库工具,是将结构化数据文件映射成为一个数据表,并提供类SQL的查询功能。

2021-04-13
1

Hive启动时 show databases; 报错

FAILED: SemanticException org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata...

2021-04-13
1