SQL DDL:存储格式&压缩

2021-09-10 11:11:23 浏览数 (1)

SQL DDL:存储格式&压缩

表存储格式的指定

内置存储格式

Hive创建表时默认使用的格式为TextFile,当然内置的存储格式除了TextFile,还有sequencefile、rcfile、ORC、Parquet、Avro。

可以使用stored as inputformat、outputformat为表指定不同的存储格式,首先TextFile存储格式为:

代码语言:javascript复制
 STORED AS INPUTFORMAT 
           'org.apache.hadoop.mapred.TextInputFormat' 
  OUTPUTFORMAT 
          'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'

但对于内置的存储格式,可以简写为stored as <TableType>,如TextFile可以直接指定为:

代码语言:javascript复制
CREATE TABLE <table_name> (<col_name> <data_type> [, <col_name> <data_type> ...])
STORED AS TEXTFILE;

当然TextFile是Hive默认的存储格式,不使用stored as进行指定,则默认为TextFile。

对于其它存储格式的指定如下:

SequenceFile:

代码语言:javascript复制
CREATE TABLE <table_name> (<col_name> <data_

0 人点赞