最新 最热

Hive 六种存储格式

AVRO、ORC、PARQUET、RCFILE、SEQUENCEFILE、TEXTFFILE

2021-04-27
0

Hive创建表语法

Hive的存储格式有六种:AVRO、ORC、PARQUET、RCFILE、SEQUENCEFILE、TEXTFFILE

2021-04-27
0

HIve内部表外部表概念

1. 外部表(external table) 有external修饰,表数据保存在HDFS上,该位置由用户指定。删除表时,只会删除表的元数据,所以外部表不是由Hive完全管理的----2. 内部表(internal table/managed table) 没有external修饰,表数据保存...

2021-04-27
0

大数据集群基本调优总结03

今天从新复习下hive,同样是Clouderamanager 的hive的配置页面,进入hive的配置选项

2021-04-27
1

Hive分区表表结构发生变动可能带来的问题?

首先,由于业务场景的需求调整可能会需要修改一些已经存在的表结构,比如增加字段、修改字段类型等,所以可能会有一些隐藏因素导致后续查询和插入数据报错;...

2021-04-22
0

最新Hive/Hadoop高频面试点小集合

如果其中有一张表为小表,直接使用map端join的方式(map端加载小表)进行聚合。

2021-04-21
0

Flink在实时在实时计算平台和实时数仓中的企业级应用小结

在过去的这几年时间里,以 Storm、Spark、Flink 为代表的实时计算技术接踵而至。2019 年阿里巴巴内部 Flink 正式开源。整个实时计算领域风起云涌,一些普通的开发者因为业务需要或者个人兴趣开始接触Flink。...

2021-04-21
1

impala + kudu | 大数据实时计算踩坑优化指南

一开始需要全量导入kudu,这时候我们先用sqoop把关系数据库数据导入临时表,再用impala从临时表导入kudu目标表由于sqoop从关系型数据直接以parquet格式导入hive会有问题,这里默认hive的表都是text格式;每次导完到临时表,需...

2021-04-21
0

MySQL提升笔记(2):存储引擎盘点

在前面我们了解了server层调用存储引擎层接口来完成sql的执行,使用存储引擎的好处是:每个存储引擎都有各自的特点,能够根据具体的应用建立不同存储引擎表。...

2021-04-19
0

CDP Private Cloud Base 7.1.4正式GA

2020年10月27日 1.平台支持如果使用Oracle 12作为元数据库,支持从HDP2.x到DC-Ambari的原地升级;支持使用Oracle 19作为元数据库,包括全新安装和升级;支持SLES 12 SP5操作系统,包括全新安装和升级;支持Postgres 11作为元数据...

2021-04-19
0