HBase的相关操作-客户端命令式
我们可以以shell的方式来维护和管理HBase。例如:执行建表语句、执行增删改查操作等等
1、进入HBase客户端命令操作界面
$ bin/hbase shell
2、查看帮助命令
hbase(main):001:0> help
3、查看当前数据库中有那些表
hbase(main):002:0> lis
4、创建一张表
创建user表,包含info、data两个列族 hbase(main):010:0> create 'user', 'info', 'data' 或者 hbase(main):010:0> create 'user', {NAME => 'info', VERSIONS => '3'},{NAME => 'data'}
5、添加数据操作
向user表中插入信息,row key为rk0001,列族info中添加name列标示符,值为zhangsan hbase(main):011:0> put 'user', 'rk0001', 'info:name', 'zhangsan'
向user表中插入信息,row key为rk0001,列族info中添加gender列标示符,值为female hbase(main):012:0> put 'user', 'rk0001', 'info:gender', 'female'
向user表中插入信息,row key为rk0001,列族info中添加age列标示符,值为20 hbase(main):013:0> put 'user', 'rk0001', 'info:age', 20
向user表中插入信息,row key为rk0001,列族data中添加pic列标示符,值为picture hbase(main):014:0> put 'user', 'rk0001', 'data:pic', 'picture'
6、查询数据操作
6.1、通过rowkey进行查询 获取user表中row key为rk0001的所有信息 hbase(main):015:0> get 'user', 'rk0001'
6.2、查看rowkey下面的某个列族的信息 获取user表中row key为rk0001,info列族的所有信息 hbase(main):016:0> get 'user', 'rk0001', 'info'
6.3、查看rowkey指定列族指定字段的值 获取user表中row key为rk0001,info列族的name、age列标示符的信息 hbase(main):017:0> get 'user', 'rk0001', 'info:name', 'info:age’
6.4、查看rowkey指定多个列族的信息 获取user表中row key为rk0001,info、data列族的信息 hbase(main):018:0> get 'user', 'rk0001', 'info', 'data' 或者你也可以这样写 hbase(main):019:0> get 'user', 'rk0001', {COLUMN => ['info', 'data']} 或者你也可以这样写,也行 hbase(main):020:0> get 'user', 'rk0001', {COLUMN => ['info:name', 'data:pic’]}
6.5、指定rowkey与列值查询 获取user表中row key为rk0001,cell的值为zhangsan的信息 hbase(main):030:0> get 'user', 'rk0001', {FILTER => "ValueFilter(=, 'binary:zhangsan')"}
6.6、查询所有数据 : 查询user表中的所有信息 scan 'user' scan 'user' , {FORMATTER => 'toString’} scan 'user' , {LIMIT => 3,FORMATTER => 'toString’}
6.7、列族查询: 查询user表中列族为info的信息 scan 'user', {COLUMNS => 'info'} scan 'user', {COLUMNS => 'info', RAW => true, VERSIONS => 5} scan 'user', {COLUMNS => 'info', RAW => true, VERSIONS => 3}
6.8、多列族查询: 查询user表中列族为info和data的信息 scan 'user', {COLUMNS => ['info', 'data']} scan 'user', {COLUMNS => ['info:name', 'data:pic']}
6.9、指定列族与某个列名查询 查询user表中列族为info、列标示符为name的信息 scan 'user', {COLUMNS => 'info:name’}
6.10、指定列族与列名以及限定版本查询 查询user表中列族为info、列标示符为name的信息,并且版本最新的5个 scan 'user', {COLUMNS => 'info:name', VERSIONS => 5}
6.11、指定多个列族与按照数据值模糊查询 查询user表中列族为info和data且列标示符中含有a字符的信息 scan 'user', {COLUMNS => ['info', 'data'], FILTER => "(QualifierFilter(=,'substring:a'))"}
6.12、rowkey的范围值查询 查询user表中列族为info,rk范围是[rk0001, rk0003)的数据 scan 'user', {COLUMNS => 'info', STARTROW => 'rk0001', ENDROW => 'rk0003'}
6.13、指定rowkey模糊查询 查询user表中row key以rk字符开头的 scan 'user',{FILTER=>"PrefixFilter('rk')"}
6.14、指定数据范围值查询 查询user表中指定范围的数据 scan 'user', {TIMERANGE => [1392368783980, 1392380169184]}
过滤器的查询地址: http://hbase.apache.org/2.2/devapidocs/index.html
7、更新数据操作
1、更新数据值 更新操作同插入操作一模一样,只不过有数据就更新,没数据就添加
2、更新版本号 将user表的f1列族版本号改为5 hbase(main):050:0> alter 'user', NAME => 'info', VERSIONS => 5
8、删除数据以及删除表操作
1、指定rowkey以及列名进行删除 删除user表row key为rk0001,列标示符为info:name的数据 hbase(main):045:0> delete 'user', 'rk0001', 'info:name'
2、指定rowkey,删除一整行数据 hbase(main):045:0> deleteall 'user', 'rk0001’ 注意: 1. deleteall 是在 hbase 2.0版本后出现的, 在2.0版本之前, 只需要使用delete这个命令即可完成所有的删除数据工作, 2. delete删除数据时候, 只会删除最新版本的数据, 而deleteall 直接将对应数据的所有的历史版本全部删除
3、删除一个列族: alter 'user', NAME => 'info', METHOD => 'delete’ 或 alter 'user', 'delete' => 'info'
4、清空表数据 hbase(main):017:0> truncate 'user'
5、删除表 首先需要先让该表为disable状态,使用命令: hbase(main):049:0> disable 'user' 然后才能drop这个表,使用命令: hbase(main):050:0> drop 'user' (注意:如果直接drop表,会报错:Drop the named table. Table must first be disabled)
9、 统计一张表有多少行数据
hbase(main):053:0> count 'user'
10、HBASE高级shell管理命令
1) status 显示服务器状态 “例如: hbase(main):058:0> status 'node01'
2) whoami : 显示HBase当前用户,例如: hbase> whoami
3) list : 显示当前所有的表
4) count: 统计指定表的记录数,例如: hbase> count 'user'
5) describe : 展示表结构信息
6) exists: 检查表是否存在,适用于表量特别多的情况
7) is_enabled、is_disabled: 检查表是否启用或禁用
8) alter : 该命令可以改变表和列族的模式, 例如: 为当前表增加列族: hbase> alter 'user', NAME => 'CF2', VERSIONS => 2 为当前表删除列族: hbase(main):002:0> alter 'user', 'delete' => 'CF2'
9) disable/enable : 禁用一张表/启用一张表
10) drop : 删除一张表,记得在删除表之前必须先禁用
11) truncate : 禁用表-删除表-创建表