当前位置: 首页 > 知识库问答 >
问题:

如何在配置单元UDF中传递配置单元conf变量?

汪信鸥
2023-03-14
hive -f ../hive/testHive.sql -hivevar testArg=${testArg}
select setUserDefinedValueForColumn(columnName,'${testArg}') from testTable;

请告诉我如何在udf中使用hive conf变量,以及如何在hive udf中访问hive配置?

共有1个答案

寿卜鹰
2023-03-14

我认为您应该使用以下命令将配置单元变量作为'hiveconf'传递:

hive --hiveconf testArg="my test args" -f ../hive/testHive.sql

然后在genericudf evalue()方法中可能有以下代码:

@Override
 public Object evaluate(DeferredObject[] args) throws HiveException {
    String myconf;
    SessionState ss = SessionState.get();
    if (ss != null) {
        HiveConf conf = ss.getConf();
        myconf= conf.get("testArg");
        System.out.println("sysout.myconf:"+ myconf);
    }
}

代码在Hive1.2上测试

 类似资料:
  • 我在java中开发了一个工作正常的配置单元udf,我的函数返回输入与配置单元表中列之间的最佳匹配,因此它有以下简化的伪代码: 我的问题是,如果这个函数是由Hive调用的,为什么我需要在代码中连接到Hive?我可以使用使用我的功能的用户所连接的当前连接吗?

  • null 我将把所有三个文件转换成标准格式(文件1格式--一个有4列的输出)。要转换为标准格式,我需要引用文件第一行中的头记录。因此,如果我的输入文件是256MB,并且调用了多个映射器,是否有任何方法使每个映射器可以引用一个全局变量(头信息)。 简而言之,是否有一种方法为所有调用我的配置单元UDF的映射器提供一个公共变量? 注意:UDF将在单个列表上运行,读取完整的行,然后将其写入下一个表HDFS

  • 添加/home/cloudera/date.jar到类路径添加资源:/home/cloudera/date.jar 请有人帮帮我,因为我是新来蜂巢的。有人能告诉我要遵循的步骤吗

  • 我看到这样一个udf: https://github.com/edwardcapriolo/hive-geoip 如何在Hive中利用udf?我可以自己创建函数名吗?

  • 我已经在hive:udfrowsequence中尝试过这个UDF。 但是它不产生唯一的值,即它依赖于映射器重复序列。 假设我有一个文件(有4条记录)在HDFS中可用。它将为该作业创建一个映射器,结果将类似于 1 2 3 4 1 2 3 4 1 2 。

  • 我将geenrated jar文件添加到hdfs目录中,使用: 我尝试使用以下命令创建一个UDf: 但是我得到了如下错误: jar文件被成功地创建并添加到Hive,但它仍然显示没有找到那个类。谁能说出它出了什么问题吗?