SQL DDL:存储格式&压缩
表存储格式的指定
内置存储格式
Hive创建表时默认使用的格式为TextFile,当然内置的存储格式除了TextFile,还有sequencefile、rcfile、ORC、Parquet、Avro。
可以使用stored as inputformat、outputformat为表指定不同的存储格式,首先TextFile存储格式为:
代码语言:javascript复制 STORED AS INPUTFORMAT
'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
但对于内置的存储格式,可以简写为stored as <TableType>,如TextFile可以直接指定为:
代码语言:javascript复制CREATE TABLE <table_name> (<col_name> <data_type> [, <col_name> <data_type> ...])
STORED AS TEXTFILE;
当然TextFile是Hive默认的存储格式,不使用stored as进行指定,则默认为TextFile。
对于其它存储格式的指定如下:
SequenceFile:
代码语言:javascript复制CREATE TABLE <table_name> (<col_name> <data_