当前位置: 首页 > 知识库问答 >
问题:

如何在配置单元UDF-Evaluate方法中使用collect_set的结果?

丁志勇
2023-03-14

配置单元查询-

select ...MYUDF(collect_set(col1))..from tableN

这里的col1是String类型。我想对这个传递的collect_set数据执行某些逻辑。对于用户定义函数,我扩展类UDF并使用evaluate方法。什么应该是评估方法作为数组的签名是从配置单元传递的。我想从UDF返回字符串数组。

public **<returnType>** evaluate(**<collect as what>**)
{
}

共有1个答案

狄宇
2023-03-14

ArrayList (import java.util.ArrayList)

 类似资料:
  • 我在java中开发了一个工作正常的配置单元udf,我的函数返回输入与配置单元表中列之间的最佳匹配,因此它有以下简化的伪代码: 我的问题是,如果这个函数是由Hive调用的,为什么我需要在代码中连接到Hive?我可以使用使用我的功能的用户所连接的当前连接吗?

  • 请告诉我如何在udf中使用hive conf变量,以及如何在hive udf中访问hive配置?

  • 我将geenrated jar文件添加到hdfs目录中,使用: 我尝试使用以下命令创建一个UDf: 但是我得到了如下错误: jar文件被成功地创建并添加到Hive,但它仍然显示没有找到那个类。谁能说出它出了什么问题吗?

  • 我已经在hive:udfrowsequence中尝试过这个UDF。 但是它不产生唯一的值,即它依赖于映射器重复序列。 假设我有一个文件(有4条记录)在HDFS中可用。它将为该作业创建一个映射器,结果将类似于 1 2 3 4 1 2 3 4 1 2 。

  • 添加/home/cloudera/date.jar到类路径添加资源:/home/cloudera/date.jar 请有人帮帮我,因为我是新来蜂巢的。有人能告诉我要遵循的步骤吗