Apache Tajo - 自定义函数



Apache Tajo 支持自定义/用户自定义函数 (UDF)。自定义函数可以用 Python 创建。

自定义函数只是带有装饰器 “@output_type(<tajo sql 数据类型>)” 的普通 Python 函数,如下所示 −

@ouput_type(“integer”) 
def sum_py(a, b): 
   return a + b; 

可以通过在 “tajosite.xml” 中添加以下配置来注册带有 UDF 的 Python 脚本。

<property> 
   <name>tajo.function.python.code-dir</name> 
   <value>file:///path/to/script1.py,file:///path/to/script2.py</value> 
</property>

一旦脚本注册,请重新启动集群,UDF 就会直接在 SQL 查询中可用,如下所示 −

select sum_py(10, 10) as pyfn; 

Apache Tajo 还支持用户自定义聚合函数,但不支持用户自定义窗口函数。

广告