- Apache Pig 教程
- Apache Pig - 首页
- Apache Pig 简介
- Apache Pig - 概述
- Apache Pig - 架构
- Apache Pig 环境
- Apache Pig - 安装
- Apache Pig - 执行
- Apache Pig - Grunt Shell
- Pig Latin
- Pig Latin - 基础
- 加载 & 存储操作符
- Apache Pig - 读取数据
- Apache Pig - 存储数据
- 诊断操作符
- Apache Pig - 诊断操作符
- Apache Pig - Describe 操作符
- Apache Pig - Explain 操作符
- Apache Pig - Illustrate 操作符
- 分组 & 连接
- Apache Pig - Group 操作符
- Apache Pig - Cogroup 操作符
- Apache Pig - Join 操作符
- Apache Pig - Cross 操作符
- Pig Latin 内置函数
- Apache Pig - Eval 函数
- 加载 & 存储函数
- Apache Pig - Bag & Tuple 函数
- Apache Pig - 字符串函数
- Apache Pig - 日期时间函数
- Apache Pig - 数学函数
- Apache Pig 有用资源
- Apache Pig - 快速指南
- Apache Pig - 有用资源
- Apache Pig - 讨论
Apache Pig - BinStorage()
BinStorage() 函数用于使用机器可读格式加载和存储数据到 Pig 中。Pig 中的 BinStorge() 通常用于存储 MapReduce 作业之间生成的临时数据。它支持多个位置作为输入。
语法
下面是 BinStorage() 函数的语法。
grunt> BinStorage();
示例
假设我们在 HDFS 目录 /pig_data/ 中有一个名为 stu_data.txt 的文件,如下所示。
Stu_data.txt
001,Rajiv_Reddy,21,Hyderabad 002,siddarth_Battacharya,22,Kolkata 003,Rajesh_Khanna,22,Delhi 004,Preethi_Agarwal,21,Pune 005,Trupthi_Mohanthy,23,Bhuwaneshwar 006,Archana_Mishra,23,Chennai 007,Komal_Nayak,24,trivendram 008,Bharathi_Nambiayar,24,Chennai
让我们将此数据加载到 Pig 中的一个关系中,如下所示。
grunt> student_details = LOAD 'hdfs://127.0.0.1:9000/pig_data/stu_data.txt' USING PigStorage(',') as (id:int, firstname:chararray, age:int, city:chararray);
现在,我们可以使用 BinStorage() 函数将此关系存储到名为 /pig_data/ 的 HDFS 目录中。
grunt> STORE student_details INTO 'hdfs://127.0.0.1:9000/pig_Output/mydata' USING BinStorage();
执行上述语句后,关系将存储在给定的 HDFS 目录中。您可以使用 HDFS 的 ls 命令查看它,如下所示。
$ hdfs dfs -ls hdfs://127.0.0.1:9000/pig_Output/mydata/ Found 2 items -rw-r--r-- 1 Hadoop supergroup 0 2015-10-26 16:58 hdfs://127.0.0.1:9000/pig_Output/mydata/_SUCCESS -rw-r--r-- 1 Hadoop supergroup 372 2015-10-26 16:58 hdfs://127.0.0.1:9000/pig_Output/mydata/part-m-00000
现在,从文件 part-m-00000 加载数据。
grunt> result = LOAD 'hdfs://127.0.0.1:9000/pig_Output/b/part-m-00000' USING BinStorage();
验证关系的内容,如下所示
grunt> Dump result; (1,Rajiv_Reddy,21,Hyderabad) (2,siddarth_Battacharya,22,Kolkata) (3,Rajesh_Khanna,22,Delhi) (4,Preethi_Agarwal,21,Pune) (5,Trupthi_Mohanthy,23,Bhuwaneshwar) (6,Archana_Mishra,23,Chennai) (7,Komal_Nayak,24,trivendram) (8,Bharathi_Nambiayar,24,Chennai)
apache_pig_load_store_functions.htm
广告