- Apache Pig 教程
- Apache Pig - 首页
- Apache Pig 简介
- Apache Pig - 概述
- Apache Pig - 架构
- Apache Pig 环境
- Apache Pig - 安装
- Apache Pig - 执行
- Apache Pig - Grunt Shell
- Pig Latin
- Pig Latin - 基础
- 加载与存储操作符
- Apache Pig - 读取数据
- Apache Pig - 存储数据
- 诊断操作符
- Apache Pig - 诊断操作符
- Apache Pig - Describe 操作符
- Apache Pig - Explain 操作符
- Apache Pig - Illustrate 操作符
- Pig Latin 内置函数
- Apache Pig - 评估函数
- 加载与存储函数
- Apache Pig - Bag 和 Tuple 函数
- Apache Pig - 字符串函数
- Apache Pig - 日期时间函数
- Apache Pig - 数学函数
- Apache Pig 有用资源
- Apache Pig - 快速指南
- Apache Pig - 有用资源
- Apache Pig - 讨论
Apache Pig - RANDOM() 函数
RANDOM() 函数用于获取一个伪随机数(double 类型),该数大于等于 0.0 且小于 1.0。
grunt> RANDOM()
示例
假设在 HDFS 目录 /pig_data/ 中有一个名为 math.txt 的文件。此文件包含如下所示的整数和浮点值。
math.txt
5 16 9 2.5 5.9 3.1
并且,我们已使用名为 math_data 的关系将此文件加载到 Pig 中,如下所示。
grunt> math_data = LOAD 'hdfs://127.0.0.1:9000/pig_data/math.txt' USING PigStorage(',') as (data:float);
现在,让我们使用 RANDOM() 函数生成 math.txt 文件内容的随机值,如下所示。
grunt> random_data = foreach math_data generate (data), RANDOM();
上述语句将结果存储在名为 random_data 的关系中。使用 Dump 操作符验证关系的内容,如下所示。
grunt> Dump random_data; (5.0,0.6842057767279982) (16.0,0.9725172591786139) (9.0,0.4159326414649489) (2.5,0.30962777780713147) (5.9,0.705213727551145) (3.1,0.24247708413861724)
apache_pig_math_functions.htm
广告