- HBase 教程
- HBase - 首页
- HBase - 概述
- HBase - 架构
- HBase - 安装
- HBase - Shell
- HBase - 常用命令
- HBase - 管理员API
- HBase - 创建表
- HBase - 列出表
- HBase - 禁用表
- HBase - 启用表
- HBase - 描述和修改
- HBase - 判断表是否存在
- HBase - 删除表
- HBase - 关闭
- HBase - 客户端API
- HBase - 创建数据
- HBase - 更新数据
- HBase - 读取数据
- HBase - 删除数据
- HBase - 扫描
- HBase - 计数和截断
- HBase - 安全性
- HBase 资源
- HBase - 常见问题解答
- HBase - 快速指南
- HBase - 有用资源
HBase - 创建数据
使用HBase Shell插入数据
本章演示如何在HBase表中创建数据。要在HBase表中创建数据,可以使用以下命令和方法:
put 命令,
Put类的add()方法,以及
HTable类的put()方法。
例如,我们将在HBase中创建以下表。
使用put命令,您可以将行插入到表中。其语法如下:
put ’<table name>’,’row1’,’<colfamily:colname>’,’<value>’
插入第一行
让我们将第一行值插入到emp表中,如下所示。
hbase(main):005:0> put 'emp','1','personal data:name','raju' 0 row(s) in 0.6600 seconds hbase(main):006:0> put 'emp','1','personal data:city','hyderabad' 0 row(s) in 0.0410 seconds hbase(main):007:0> put 'emp','1','professional data:designation','manager' 0 row(s) in 0.0240 seconds hbase(main):007:0> put 'emp','1','professional data:salary','50000' 0 row(s) in 0.0240 seconds
以相同的方式使用put命令插入其余行。如果您插入整个表,您将获得以下输出。
hbase(main):022:0> scan 'emp' ROW COLUMN+CELL 1 column=personal data:city, timestamp=1417524216501, value=hyderabad 1 column=personal data:name, timestamp=1417524185058, value=ramu 1 column=professional data:designation, timestamp=1417524232601, value=manager 1 column=professional data:salary, timestamp=1417524244109, value=50000 2 column=personal data:city, timestamp=1417524574905, value=chennai 2 column=personal data:name, timestamp=1417524556125, value=ravi 2 column=professional data:designation, timestamp=1417524592204, value=sr:engg 2 column=professional data:salary, timestamp=1417524604221, value=30000 3 column=personal data:city, timestamp=1417524681780, value=delhi 3 column=personal data:name, timestamp=1417524672067, value=rajesh 3 column=professional data:designation, timestamp=1417524693187, value=jr:engg 3 column=professional data:salary, timestamp=1417524702514, value=25000
使用Java API插入数据
您可以使用Put类的add()方法将数据插入Hbase。您可以使用HTable类的put()方法保存它。这些类属于org.apache.hadoop.hbase.client包。以下是创建HBase表数据的步骤。
步骤1:实例化Configuration类
Configuration类将HBase配置文件添加到其对象中。您可以使用HbaseConfiguration类的create()方法创建配置对象,如下所示。
Configuration conf = HbaseConfiguration.create();
步骤2:实例化HTable类
您有一个名为HTable的类,它是HBase中Table的实现。此类用于与单个HBase表进行通信。在实例化此类时,它接受配置对象和表名作为参数。您可以如下所示实例化HTable类。
HTable hTable = new HTable(conf, tableName);
步骤3:实例化Put类
要将数据插入HBase表,可以使用add()方法及其变体。此方法属于Put,因此实例化put类。此类需要您要将数据插入其中的行名(字符串格式)。您可以如下所示实例化Put类。
Put p = new Put(Bytes.toBytes("row1"));
步骤4:插入数据
Put类的add()方法用于插入数据。它需要3个字节数组分别表示列族、列限定符(列名)和要插入的值。使用add()方法将数据插入HBase表,如下所示。
p.add(Bytes.toBytes("coloumn family "), Bytes.toBytes("column name"),Bytes.toBytes("value"));
步骤5:保存表中的数据
插入所需行后,通过将put实例添加到HTable类的put()方法来保存更改,如下所示。
hTable.put(p);
步骤6:关闭HTable实例
在HBase表中创建数据后,使用close()方法关闭HTable实例,如下所示。
hTable.close();
以下是创建HBase表数据的完整程序。
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.client.HTable; import org.apache.hadoop.hbase.client.Put; import org.apache.hadoop.hbase.util.Bytes; public class InsertData{ public static void main(String[] args) throws IOException { // Instantiating Configuration class Configuration config = HBaseConfiguration.create(); // Instantiating HTable class HTable hTable = new HTable(config, "emp"); // Instantiating Put class // accepts a row name. Put p = new Put(Bytes.toBytes("row1")); // adding values using add() method // accepts column family name, qualifier/row name ,value p.add(Bytes.toBytes("personal"), Bytes.toBytes("name"),Bytes.toBytes("raju")); p.add(Bytes.toBytes("personal"), Bytes.toBytes("city"),Bytes.toBytes("hyderabad")); p.add(Bytes.toBytes("professional"),Bytes.toBytes("designation"), Bytes.toBytes("manager")); p.add(Bytes.toBytes("professional"),Bytes.toBytes("salary"), Bytes.toBytes("50000")); // Saving the put Instance to the HTable. hTable.put(p); System.out.println("data inserted"); // closing HTable hTable.close(); } }
编译并执行上述程序,如下所示。
$javac InsertData.java $java InsertData
输出应如下所示:
data inserted