- Apache Tajo 教程
- Apache Tajo - 主页
- Apache Tajo - 介绍
- Apache Tajo - 架构
- Apache Tajo - 安装
- Apache Tajo - 配置设置
- Apache Tajo - Shell 命令
- Apache Tajo - 数据类型
- Apache Tajo - 运算符
- Apache Tajo - SQL 函数
- Apache Tajo - 数学函数
- Apache Tajo - 字符串函数
- Apache Tajo - 日期时间函数
- Apache Tajo - JSON 函数
- Apache Tajo - 数据库创建
- Apache Tajo - 表管理
- Apache Tajo - SQL 语句
- 聚合和窗口函数
- Apache Tajo - SQL 查询
- Apache Tajo - 存储插件
- 与 HBase 集成
- Apache Tajo - 与 Hive 集成
- OpenStack Swift 集成
- Apache Tajo - JDBC 接口
- Apache Tajo - 自定义函数
- Apache Tajo 有用资源
- Apache Tajo - 快速指南
- Apache Tajo - 有用资源
- Apache Tajo - 讨论
Apache Tajo - 自定义函数
Apache Tajo 支持自定义/用户自定义函数 (UDF)。自定义函数可以用 Python 创建。
自定义函数只是带有装饰器 “@output_type(<tajo sql 数据类型>)” 的普通 Python 函数,如下所示 −
@ouput_type(“integer”) def sum_py(a, b): return a + b;
可以通过在 “tajosite.xml” 中添加以下配置来注册带有 UDF 的 Python 脚本。
<property> <name>tajo.function.python.code-dir</name> <value>file:///path/to/script1.py,file:///path/to/script2.py</value> </property>
一旦脚本注册,请重新启动集群,UDF 就会直接在 SQL 查询中可用,如下所示 −
select sum_py(10, 10) as pyfn;
Apache Tajo 还支持用户自定义聚合函数,但不支持用户自定义窗口函数。
广告