最新 最热

hive-行转列按顺序合并

目录一、背景二、实现1.建表ddl2.示例数据3.按顺序合并4.按顺序合并结果5.可以看到最后一条最长的才是我们需要的数据6.结果--------一、背景想实现行转列按顺序合并,但是impala不支持,故用hive实现二、实现1.建表ddlcr...

2022-11-13
1

【踩坑实录】-No enum constant com.alibaba.datax.plugin.writer.hdfswriter.SupportHiveDataType.DECIMAL(6,4)

java.lang.IllegalArgumentException: No enum constant com.alibaba.datax.plugin.writer.hdfswriter.SupportHiveDataType.DECIMAL(6,4)

2022-11-13
1

【踩坑实录】-bucketId out of range: -1 (state=,code=0)

java.io.IOException: java.lang.IllegalArgumentException: Bucket ID out of range: -1

2022-11-13
1

DataX数据同步实战案例

DataX 是阿里云DataWorks数据集成的开源版本,在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX 实现了包括 MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxC...

2022-11-13
1

sqoop命令参数参考说明及案例示例

3.全量导入(将数据从mysql导入到hive,hive表不存在,导入时自动创建hive表)

2022-11-13
1

【踩坑实录】hive cli查询不显示表头

set hive.resultset.use.unique.column.names=false;

2022-11-13
1

【踩坑实录】hive删除字段报错

a STRING COMMENT '哈哈',  b BIGINT COMMENT '嘻嘻',   c STRING COMMENT 'c' )

2022-11-13
1

SQL之mysql到hive批量生成建表语句

数据采集时如果使用datax的话,必须先手工建好表之后才能进行数据采集;使用sqoop的话虽然可以默认建表,但是每次还要手工配置命令。表数量不多的话还好,如果多库多表需要批量采集的话工作量会很大,因此需要一个批量生成建表...

2022-11-13
1

hive创建唯一标识列(自增id)

在某一张 hive 表中需要有一列去唯一标识某一行,有些类似于MySQL中的自增ID

2022-11-13
1

hive索引

在关系数据库中,索引是一种单独的、物理的对数据库表中一列或多列的值进行排序的一种存储结构,它是某个表中一列或若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单。索引的作用相当于图书的目录,可...

2022-11-13
1