当前位置: 首页 > 知识库问答 >
问题:

配置单元中的UDF执行过程

羊舌光赫
2023-03-14

我已经为hive创建了一个名为Zodiac的UDF,然后添加了JAR文件,并在hive中创建了临时函数。

Select Zodiac(Dateofbirth) from Student;

共有1个答案

李敏学
2023-03-14

在您的示例中,Hive将调用ZodiacUDF的Evalue方法整整50次。

您可以将日志添加到evalue方法中,并自己检查。

 类似资料:
  • 我在java中开发了一个工作正常的配置单元udf,我的函数返回输入与配置单元表中列之间的最佳匹配,因此它有以下简化的伪代码: 我的问题是,如果这个函数是由Hive调用的,为什么我需要在代码中连接到Hive?我可以使用使用我的功能的用户所连接的当前连接吗?

  • 我已经在hive:udfrowsequence中尝试过这个UDF。 但是它不产生唯一的值,即它依赖于映射器重复序列。 假设我有一个文件(有4条记录)在HDFS中可用。它将为该作业创建一个映射器,结果将类似于 1 2 3 4 1 2 3 4 1 2 。

  • 我有一个配置单元Udf,在配置单元终端工作良好,我想我想通过shell脚本执行它。在配置单元终端上,我可以执行以下命令: 然后我得到返回代码1 配置单元Udf是否支持shell脚本,如果它做错了我正在做什么。提前致谢

  • 添加/home/cloudera/date.jar到类路径添加资源:/home/cloudera/date.jar 请有人帮帮我,因为我是新来蜂巢的。有人能告诉我要遵循的步骤吗

  • 我看到这样一个udf: https://github.com/edwardcapriolo/hive-geoip 如何在Hive中利用udf?我可以自己创建函数名吗?

  • TL;DR:我如何在Hive中更新自定义UDF的jar? 我写了自己的(通用)udf,工作得很好。我可以定义一个新函数,并将其与命令一起使用: null null