Apache Presto - HIVE 连接器



Hive 连接器允许查询存储在 Hive 数据仓库中的数据。

先决条件

  • Hadoop
  • Hive

希望您已在您的机器上安装了 Hadoop 和 Hive。在新终端中逐个启动所有服务。然后,使用以下命令启动 Hive 元存储,

hive --service metastore

Presto 使用 Hive 元存储服务来获取 Hive 表的详细信息。

配置设置

在“etc/catalog”目录下创建文件“hive.properties”。使用以下命令。

$ cd etc 
$ cd catalog 
$ vi hive.properties  

connector.name = hive-cdh4 
hive.metastore.uri = thrift://127.0.0.1:9083

完成所有更改后,保存文件并退出终端。

创建数据库

使用以下查询在 Hive 中创建一个数据库 −

查询

hive> CREATE SCHEMA tutorials; 

创建数据库后,您可以使用“show databases”命令对其进行验证。

创建表

创建表是一个用于在 Hive 中创建表的语句。例如,使用以下查询。

hive> create table author(auth_id int, auth_name varchar(50), 
topic varchar(100) STORED AS SEQUENCEFILE;

插入表

以下查询用于在 Hive 表中插入记录。

hive> insert into table author values (1,’ Doug Cutting’,Hadoop),
(2,’ James Gosling’,java),(3,’ Dennis Ritchie’,C);

启动 Presto CLI

您可以启动 Presto CLI 以使用以下命令连接 Hive 存储插件。

$ ./presto --server localhost:8080 --catalog hive —schema tutorials; 

您将收到以下答复。

presto:tutorials >

列出模式

若要列出 Hive 连接器中的所有模式,请键入以下命令。

查询

presto:tutorials > show schemas from hive;

结果

default  

tutorials 

列出表格

若要列出“tutorials”架构中的所有表格,请使用以下查询。

查询

presto:tutorials > show tables from hive.tutorials; 

结果

author

获取表格

以下查询用于从 Hive 表中提取所有记录。

查询

presto:tutorials > select * from hive.tutorials.author; 

结果

auth_id  |   auth_name    | topic 
---------+----------------+-------- 
       1 | Doug Cutting   | Hadoop 
       2 | James Gosling  | java 
       3 | Dennis Ritchie | C
广告