最新 最热

CDP PVC基础版的新功能

如果您是CDH或HDP用户,则除了从CDH和HDP版本转移到CDP的功能之外,还可以查看CDP私有云基础版中可用的新功能。

2021-01-08
1

大数据开发:基于Hadoop的数仓设计

企业级的大数据平台,Hadoop至今仍然占据重要的地位,而基于Hadoop去进行数据平台的架构设计,是非常关键且重要的一步,在实际工作当中,往往需要有经验的开发工程师或者架构师去完成。今天的大数据开发分享,我们就来讲讲,基于Ha...

2021-01-08
1

Hive Schema Tool元数据运维

较早的Hive版本,不会在MetaStore中写入版本号。所以升级到新版本之后,会报错:

2021-01-07
1

企业常用Hive SQL配置

在企业中使用Hive SQL需要一定的规范。一般在SQL编写之前,需要进行规范的注释添加,并设定特定的配置。

2021-01-07
0

HDFS权限管控

HDFS在权限管控时,提供类似POSIX系统的文件和目录权限模型,这里称为普通权限管控。它和在linux系统上的操作类似,每个文件或目录都有owner、group、other三种角色,它们拥有不同的权限。权限分为r、w、x三种。rwx权限,也可...

2021-01-07
0

关于较大规模hadoop集群的小文件问题

上一遍记录了当时集群资源死锁的问题,后来想了想其实小文件较多也会让集群变慢,小文件较多在执行作业时rpc时间就会增加,从而拖垮了job的执行速度。...

2021-01-06
1

漫谈千亿级数据优化实践:数据倾斜

相信大部分做数据的童鞋们都会遇到数据倾斜,数据倾斜会发生在数据开发的各个环节中,比如:

2021-01-06
0

Hive表类型(存储格式)一览

Hive支持的表类型,或者称为存储格式有:TextFile、SequenceFile、RCFile、ORC、Parquet、AVRO。

2021-01-06
0

Hive常见的压缩格式

Hive支持的压缩格式有bzip2、gzip、deflate、snappy、lzo等。Hive依赖Hadoop的压缩方法,所以Hadoop版本越高支持的压缩方法越多,可以在$HADOOP_HOME/conf/core-site.xml中进行配置:...

2021-01-06
1

ORC与Parquet表的压缩

除了直接配置MapReduce压缩功能外,Hive的ORC表和Parquet表直接支持表的压缩属性。

2021-01-06
0