如何在配置单元UDF中传递配置单元conf变量？

汪信鸥

2023-03-14

hive -f ../hive/testHive.sql -hivevar testArg=${testArg}

select setUserDefinedValueForColumn(columnName,'${testArg}') from testTable;

请告诉我如何在udf中使用hive conf变量，以及如何在hive udf中访问hive配置？

共有1个答案

寿卜鹰

2023-03-14

我认为您应该使用以下命令将配置单元变量作为'hiveconf'传递：

hive --hiveconf testArg="my test args" -f ../hive/testHive.sql

然后在genericudf evalue()方法中可能有以下代码：

@Override
 public Object evaluate(DeferredObject[] args) throws HiveException {
    String myconf;
    SessionState ss = SessionState.get();
    if (ss != null) {
        HiveConf conf = ss.getConf();
        myconf= conf.get("testArg");
        System.out.println("sysout.myconf:"+ myconf);
    }
}

代码在Hive1.2上测试

类似资料：

使用配置单元表的配置单元UDF

我在java中开发了一个工作正常的配置单元udf，我的函数返回输入与配置单元表中列之间的最佳匹配，因此它有以下简化的伪代码：我的问题是，如果这个函数是由Hive调用的，为什么我需要在代码中连接到Hive？我可以使用使用我的功能的用户所连接的当前连接吗？
配置单元UDF全局变量

null 我将把所有三个文件转换成标准格式（文件1格式--一个有4列的输出）。要转换为标准格式，我需要引用文件第一行中的头记录。因此，如果我的输入文件是256MB，并且调用了多个映射器，是否有任何方法使每个映射器可以引用一个全局变量（头信息）。简而言之，是否有一种方法为所有调用我的配置单元UDF的映射器提供一个公共变量？注意：UDF将在单个列表上运行，读取完整的行，然后将其写入下一个表HDFS
创建配置单元UDF

添加/home/cloudera/date.jar到类路径添加资源：/home/cloudera/date.jar 请有人帮帮我，因为我是新来蜂巢的。有人能告诉我要遵循的步骤吗
实现配置单元UDF

我看到这样一个udf： https://github.com/edwardcapriolo/hive-geoip 如何在Hive中利用udf？我可以自己创建函数名吗？
配置单元中的序号UDF

我已经在hive：udfrowsequence中尝试过这个UDF。但是它不产生唯一的值，即它依赖于映射器重复序列。假设我有一个文件（有4条记录）在HDFS中可用。它将为该作业创建一个映射器，结果将类似于 1 2 3 4 1 2 3 4 1 2 。
无法在配置单元中添加UDF

我将geenrated jar文件添加到hdfs目录中，使用：我尝试使用以下命令创建一个UDf：但是我得到了如下错误： jar文件被成功地创建并添加到Hive，但它仍然显示没有找到那个类。谁能说出它出了什么问题吗？

如何在配置单元UDF中传递配置单元conf变量？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档