HBase - 创建数据



使用HBase Shell插入数据

本章演示如何在HBase表中创建数据。要在HBase表中创建数据,可以使用以下命令和方法:

  • put 命令,

  • Put类的add()方法,以及

  • HTable类的put()方法。

例如,我们将在HBase中创建以下表。

HBase Table

使用put命令,您可以将行插入到表中。其语法如下:

put ’<table name>’,’row1’,’<colfamily:colname>’,’<value>’

插入第一行

让我们将第一行值插入到emp表中,如下所示。

hbase(main):005:0> put 'emp','1','personal data:name','raju'
0 row(s) in 0.6600 seconds
hbase(main):006:0> put 'emp','1','personal data:city','hyderabad'
0 row(s) in 0.0410 seconds
hbase(main):007:0> put 'emp','1','professional
data:designation','manager'
0 row(s) in 0.0240 seconds
hbase(main):007:0> put 'emp','1','professional data:salary','50000'
0 row(s) in 0.0240 seconds

以相同的方式使用put命令插入其余行。如果您插入整个表,您将获得以下输出。

hbase(main):022:0> scan 'emp'

   ROW                        COLUMN+CELL
1 column=personal data:city, timestamp=1417524216501, value=hyderabad

1 column=personal data:name, timestamp=1417524185058, value=ramu

1 column=professional data:designation, timestamp=1417524232601,

 value=manager
 
1 column=professional data:salary, timestamp=1417524244109, value=50000

2 column=personal data:city, timestamp=1417524574905, value=chennai

2 column=personal data:name, timestamp=1417524556125, value=ravi

2 column=professional data:designation, timestamp=1417524592204,

 value=sr:engg
 
2 column=professional data:salary, timestamp=1417524604221, value=30000

3 column=personal data:city, timestamp=1417524681780, value=delhi

3 column=personal data:name, timestamp=1417524672067, value=rajesh

3 column=professional data:designation, timestamp=1417524693187,

value=jr:engg
3 column=professional data:salary, timestamp=1417524702514,

value=25000 

使用Java API插入数据

您可以使用Put类的add()方法将数据插入Hbase。您可以使用HTable类的put()方法保存它。这些类属于org.apache.hadoop.hbase.client包。以下是创建HBase表数据的步骤。

步骤1:实例化Configuration类

Configuration类将HBase配置文件添加到其对象中。您可以使用HbaseConfiguration类的create()方法创建配置对象,如下所示。

Configuration conf = HbaseConfiguration.create();

步骤2:实例化HTable类

您有一个名为HTable的类,它是HBase中Table的实现。此类用于与单个HBase表进行通信。在实例化此类时,它接受配置对象和表名作为参数。您可以如下所示实例化HTable类。

HTable hTable = new HTable(conf, tableName);

步骤3:实例化Put类

要将数据插入HBase表,可以使用add()方法及其变体。此方法属于Put,因此实例化put类。此类需要您要将数据插入其中的行名(字符串格式)。您可以如下所示实例化Put类。

Put p = new Put(Bytes.toBytes("row1"));

步骤4:插入数据

Put类的add()方法用于插入数据。它需要3个字节数组分别表示列族、列限定符(列名)和要插入的值。使用add()方法将数据插入HBase表,如下所示。

p.add(Bytes.toBytes("coloumn family "), Bytes.toBytes("column
name"),Bytes.toBytes("value"));

步骤5:保存表中的数据

插入所需行后,通过将put实例添加到HTable类的put()方法来保存更改,如下所示。

hTable.put(p); 

步骤6:关闭HTable实例

在HBase表中创建数据后,使用close()方法关闭HTable实例,如下所示。

hTable.close(); 

以下是创建HBase表数据的完整程序。

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.util.Bytes;

public class InsertData{

   public static void main(String[] args) throws IOException {

      // Instantiating Configuration class
      Configuration config = HBaseConfiguration.create();

      // Instantiating HTable class
      HTable hTable = new HTable(config, "emp");

      // Instantiating Put class
      // accepts a row name.
      Put p = new Put(Bytes.toBytes("row1")); 

      // adding values using add() method
      // accepts column family name, qualifier/row name ,value
      p.add(Bytes.toBytes("personal"),
      Bytes.toBytes("name"),Bytes.toBytes("raju"));

      p.add(Bytes.toBytes("personal"),
      Bytes.toBytes("city"),Bytes.toBytes("hyderabad"));

      p.add(Bytes.toBytes("professional"),Bytes.toBytes("designation"),
      Bytes.toBytes("manager"));

      p.add(Bytes.toBytes("professional"),Bytes.toBytes("salary"),
      Bytes.toBytes("50000"));
      
      // Saving the put Instance to the HTable.
      hTable.put(p);
      System.out.println("data inserted");
      
      // closing HTable
      hTable.close();
   }
}

编译并执行上述程序,如下所示。

$javac InsertData.java
$java InsertData

输出应如下所示:

data inserted
广告