当前位置: 首页 > 知识库问答 >
问题:

配置单元:配置单元UDF中创建函数和创建临时函数的区别

凌智
2023-03-14
CREATE FUNCTION country AS 'com.hiveudf.employeereview.Country';

CREATE TEMPORARY FUNCTION country AS 'com.hiveudf.employeereview.Country';

我找不到以上两种方式有什么不同。有人能给我解释一下或者指导我正确的材料吗?

共有1个答案

郝玄天
2023-03-14

create function和create tmp function的主要区别在于:在Hive0.13或更高版本中,函数可以注册到METALORE,因此可以在查询中引用它们,而不必在每个会话中创建临时函数。

如果我们使用创建临时函数,我们将不得不在每次启动新会话时重新创建该函数。

参考:https://cwiki.apache.org/confluence/display/hive/languagemanual+ddl#languagemanualddl-create/drop/reloadfunction

 类似资料:
  • 添加/home/cloudera/date.jar到类路径添加资源:/home/cloudera/date.jar 请有人帮帮我,因为我是新来蜂巢的。有人能告诉我要遵循的步骤吗

  • 您的回应将不胜感激。谢了!

  • 摘要:关注与Hive中的UDF创建有关。 亲爱的朋友们,由于我是在Hive中创建UDF的新手(我通过google读过这方面的文章,但不是很清楚),我在这里的第一件事是确定哪一种可能是最好的方式,比如Java/Python或任何其他方式来编写Hive UDF。 另一件事是我应该在什么基础上分析?我应该寻找什么参数?

  • 显然,它不会产生上面的输出,因为只有一个映射器,并且调用了相同的udf实例,该实例在总集上生成一个运行和。我的目标是为每个storeid重置udf类中的runningSum实例变量,以便evaluate函数返回上述输出。我使用了以下内容:1。传递storeid变量rsum(sales,storeid),然后我们就可以在udf类中正确地处理这种情况。2.使用以下查询中的2个映射器: 为什么1002总

  • 我在java中开发了一个工作正常的配置单元udf,我的函数返回输入与配置单元表中列之间的最佳匹配,因此它有以下简化的伪代码: 我的问题是,如果这个函数是由Hive调用的,为什么我需要在代码中连接到Hive?我可以使用使用我的功能的用户所连接的当前连接吗?

  • 这是将Spark dataframe保存为Hive中的动态分区表的后续操作。我试图在答案中使用建议,但无法在Spark 1.6.1中使用 任何推动这一进程的帮助都是感激的。 编辑:还创建了SPARK-14927