最新 最热

0829-5.15.1-Hive锁表导致CM无法启动异常分析

本文描述了一次CDH集群中,Hive锁表导致集群元数据MySQL的Hive MetaStore锁表,从而引起CM服务中断并且无法重启的异常分析。

2021-03-11
1

初识大数据与Hadoop

在大数据时代,基于大数据技术的职位更有钱途,因此成为很多人的职业首选。在大数据技术中,大家常常听到 Hadoop,很多刚开始接触的人会问,什么是 Hadoop?它有什么作用?下面笔者就跟大家唠叨唠叨。...

2021-03-09
1

数据分析工具篇——HQL中DDL操作

1.1) CREATE TABLE 创建一个指定名字的表。如果相同名字的表已经存在,则抛出异常;用户可以用 IF NOT EXISTS 选项来忽略这个异常。

2021-03-09
0

美团外卖特征平台的建设与实践

随着美团外卖业务的发展,算法模型也在不断演进迭代中。本文从特征框架演进、特征生产、特征获取计算以及训练样本生成四个方面介绍了美团外卖特征平台在建设与实践中的思考和优化思路。...

2021-03-09
1

Apache NIFI v1.13.0发布了

回顾2020年,Apache NIFI一共发布了7个版本1.12.1、1.12.0、1.11.4、1.11.3、1.11.2、1.11.1、1.11.0。版本发布之频繁前所未有,可以看出NIFI的开源社区贡献力量壮大了许多,同时也更加期待NIFI未来能够给我们带来更多的惊...

2021-03-07
1

Impala在网易大数据的优化和实践

导读:网易大数据平台的底层数据查询引擎,选用了Impala作为OLAP查询引擎,不但支撑了网易大数据的交互式查询与自助分析,还为外部客户提供了商业化的产品与服务。今天将为大家分享下Impala在网易大数据的优化和实践。...

2021-03-05
0

网易数据湖探索与实践-范欣欣

导读:今天主要和大家交流的是网易在数据湖Iceberg的一些思考与实践。从网易在数据仓库建设中遇到的痛点出发,介绍对数据湖Iceberg的探索以及实践之路。...

2021-03-05
1

Kylin 最佳实践|爱奇艺如何处理千亿级数据

爱奇艺发展的大体时间线,2015 年前以离线分析为主,技术上是经典的 Hive + MySQL 方案,但缺点是报表查询比较慢,而且数据时效性差;2016 - 2018 年致力于将查询耗时提升至交互式级别,分为两大类:Kylin 针对固定报表,在维度比较...

2021-03-05
1

fs.defaultFS 变更,使spark-sql 查询hive失败原因分析

这个是粉丝投稿,很有价值,浪尖在这里给大家分享一下,也使得后面有粉丝遇到相同的问题,可以快速的解决,节省时间。

2021-03-05
0

大厂都在用的Hive优化

Hive作为大数据分析领域常用的仓库工具,即使是现在流式计算如火如荼背景下,Hive依然倍受各大厂商挚爱。使用Hive过程中,面对各种各样的查询需求,需要具有针对性的优化下面内容就给大家分别介绍下。...

2021-03-05
1