Hbase Shell 常用命令

1、进入Hbase Shell

  • 进入Hbase Shell客户端命令操作界面
hbase shell

2、查看帮助

  • 通用查看帮助命令
hbase(main):001:0> help
  • 查看某些命令的操作方法
hbase(main):001:0> help "scan"

3、查看库表清单

  • 查看当前数据库中有哪些表
hbase(main):006:0> list
  • 列出所有namespace
hbase(main):001:0> list_namespace
  • 在namespace下创建表
hbase(main):001:0> create 'database1:testtable', 'fm1'
  • 查看namespace下的表
hbase(main):001:0> list_namespace_tables 'database1'
  • 创建namespace
hbase(main):001:0> create_namespace 'database1'
  • 删除namespace
hbase(main):001:0> drop_namespace 'database1'

4、创建表

  • 创建一张lagou表, 包含base_info、extra_info两个列族,方法一,最简单
hbase(main):001:0> create 'lagou', 'base_info', 'extra_info' 
  • 创建一张lagou表, 包含base_info、extra_info两个列族,方法二 ,指定保存版本
hbase(main):001:0> create 'lagou', {NAME => 'base_info', VERSIONS => '3'},{NAME => 'extra_info',VERSIONS => '3'} 

# Hbase建表必须指定列族信息 
# VERSIONS 是指此单元格内的数据可以保留最近的 3 个版本
  • 创建一个t_task_log表,并且设置TTL生存期
hbase(main):001:0> create 't_task_log',{NAME => 'f', TTL=>'86400'}

# 创建t_task_log表,列族f, TTL设置86400秒过期
# 在major合并过程中时间戳被判定为超过TTL的数据会被自动删除(TTL参数的单位是秒)
  • 手动指定预分区
hbase(main):037:0> create 'person','info1','info2',SPLITS => ['1000','2000','3000']
  • 也可以把分区规则创建于文件中
vim split.txt

文件内容:
aaa 
bbb 
ccc 
ddd

执行
hbase(main):037:0> create 'student','info',SPLITS_FILE => '/root/hbase/split.txt'

5、插入数据

  • 向lagou表中插入信息,row key为 rk1,列族base_info中添加name列标示符,值为wang
hbase(main):001:0> put 'lagou', 'rk1', 'base_info:name', 'wang'
  • 向lagou表中插入信息,row key为rk1,列族base_info中添加age列标示符,值为30
hbase(main):001:0> put 'lagou', 'rk1', 'base_info:age', 30
  • 向lagou表中插入信息,row key为rk1,列族extra_info中添加address列标示符,值为shanghai
hbase(main):001:0> put 'lagou', 'rk1', 'extra_info:address', 'shanghai'

6、查询数据

6.1 通过rowkey进行查询

  • 获取表中row key为rk1的所有信息
hbase(main):001:0> get 'lagou', 'rk1'

6.2 查看rowkey下面的某个列族的信息

  • 获取lagou表中row key为rk1,base_info列族的所有信息
hbase(main):001:0> get 'lagou', 'rk1', 'base_info'

6.3 查看rowkey指定列族指定字段的值

  • 获取表中row key为rk1,base_info列族的name、age列标示符的信息
hbase(main):008:0> get 'lagou', 'rk1', 'base_info:name', 'base_info:age'

6.4 查看rowkey指定多个列族的信息

  • 获取lagou表中row key为rk1,base_info、extra_info列族的信息
hbase(main):010:0> get 'lagou', 'rk1', 'base_info', 'extra_info' 
或者 
hbase(main):011:0> get 'lagou', 'rk1', {COLUMN => ['base_info', 'extra_info']} 
或者 
hbase(main):012:0> get 'lagou', 'rk1', {COLUMN => ['base_info:name', 'extra_info:address']}

6.5 指定rowkey与列值查询

  • 获取表中row key为rk1,cell的值为wang的信息
hbase(main):001:0> get 'lagou', 'rk1', {FILTER => "ValueFilter(=, 'binary:wang')"}

6.6 指定rowkey与列值模糊查询

  • 获取表中rowkey为rk1,列标示符中含有a的新信息
hbase(main):001:0> get 'lagou', 'rk1', {FILTER => " (QualifierFilter(=,'substring:a'))"}

6.7 查询所有数据

  • 查询lagou表中的所有信息
hbase(main):000:0> scan 'lagou'

6.8 列族查询

  • 查询表中列族为 base_info 的信息
hbase(main):001:0> scan 'lagou', {COLUMNS => 'base_info'} 
hbase(main):002:0> scan 'lagou', {COLUMNS => 'base_info', RAW => true, VERSIONS => 3} 

## Scan时可以设置是否开启Raw模式,开启Raw模式会返回包括已添加删除标记但是未实际删除的数据
## VERSIONS指定查询的最大版本数

6.9 指定多个列族与按照数据值模糊查询

  • 查询lagou表中列族为 base_info 和 extra_info且列标示符中含有a字符的信息
hbase(main):001:0> scan 'lagou', {COLUMNS => ['base_info', 'extra_info'], FILTER => "(QualifierFilter(=,'substring:a'))"}

6.10 rowkey的范围值查询(非常重要)

  • 查询lagou表中列族为base_info,rk范围是[rk1, rk3)的数据(rowkey底层存储是字典序)
  • 按rowkey顺序存储。
hbase(main):001:0> scan 'lagou', {COLUMNS => 'base_info', STARTROW => 'rk1', ENDROW => 'rk3'}

6.11 指定rowkey模糊查询

  • 查询lagou表中row key以rk字符开头的
hbase(main):001:0> scan 'lagou',{FILTER=>"PrefixFilter('rk')"}

7、更新数据

  • 更新操作同插入操作一模一样,只不过有数据就更新,没数据就添加

  • 把lagou表中rowkey为rk1的base_info列族下的列name修改为liang

hbase(main):030:0> put 'lagou', 'rk1', 'base_info:name', 'liang'

8、删除数据

8.1 指定rowkey以及列名进行删除

  • 删除lagou表row key为rk1,列标示符为 base_info:name 的数据
hbase(main):002:0> delete 'lagou', 'rk1', 'base_info:name'

8.2 指定rowkey,列名以及时间戳信息进行删除

  • 删除lagou表row key为rk1,列标示符为base_info:name的数据
scan 'lagou', {COLUMNS => 'base_info', RAW => true, VERSIONS => 3} 
ROW                                                         COLUMN+CELL
 rk1                                                        column=base_info:age, timestamp=1641797055275, value=30
 rk1                                                        column=base_info:name, timestamp=1641797189784, type=Delete     
 rk1                                                        column=base_info:name, timestamp=1641797189784, value=liang
 rk1                                                        column=base_info:name, timestamp=1641797051271, value=wang 

hbase(main):033:0> delete 'lagou', 'rk1', 'base_info:name',1600660619655 
hbase(main):023:0> scan 'lagou', {COLUMNS => 'base_info', RAW => true, VERSIONS => 3} 
ROW                                                         COLUMN+CELL                                                      
 rk1                                                        column=base_info:age, timestamp=1641797055275, value=30
 rk1                                                        column=base_info:name, timestamp=1641797189784, type=Delete
 rk1                                                        column=base_info:name, timestamp=1641797189784, value=liang
 rk1                                                        column=base_info:name, timestamp=1641797051271, value=wang
 rk1                                                        column=base_info:name, timestamp=1600660619655, type=Delete

8.3 删除列族

  • 删除 base_info 列族
hbase(main):001:0>

hbase(main):035:0> alter 'lagou', 'delete' => 'base_info'

8.4 清空表数据

  • 删除lagou表数据
hbase(main):001:0> truncate 'lagou'

8.5 删除表

  • 删除lagou表
#先disable 再drop 
hbase(main):036:0> disable 'lagou' 
hbase(main):037:0> drop 'lagou' 

#如果不进行disable,直接drop会报错 ERROR: Table user is enabled. Disable it first.