当前位置: 首页 > 知识库问答 >
问题:

用udf创建配置单元表

吴建中
2023-03-14

您的回应将不胜感激。谢了!

共有1个答案

訾晋
2023-03-14

这就是所谓的柱掩蔽。要实现这一点,您通常将Presto(或Hive)与Ranger security一起使用,并在其中配置列屏蔽。

Ranger定义了一组预定义的掩码(例如,除了最后4个字符/数字之外的所有掩码,等等)。

Ranger还允许自定义掩码(自由样式表达式),但Presto还不支持这一点。

 类似资料:
  • 添加/home/cloudera/date.jar到类路径添加资源:/home/cloudera/date.jar 请有人帮帮我,因为我是新来蜂巢的。有人能告诉我要遵循的步骤吗

  • 我在java中开发了一个工作正常的配置单元udf,我的函数返回输入与配置单元表中列之间的最佳匹配,因此它有以下简化的伪代码: 我的问题是,如果这个函数是由Hive调用的,为什么我需要在代码中连接到Hive?我可以使用使用我的功能的用户所连接的当前连接吗?

  • 我找不到以上两种方式有什么不同。有人能给我解释一下或者指导我正确的材料吗?

  • 摘要:关注与Hive中的UDF创建有关。 亲爱的朋友们,由于我是在Hive中创建UDF的新手(我通过google读过这方面的文章,但不是很清楚),我在这里的第一件事是确定哪一种可能是最好的方式,比如Java/Python或任何其他方式来编写Hive UDF。 另一件事是我应该在什么基础上分析?我应该寻找什么参数?

  • 我看到这样一个udf: https://github.com/edwardcapriolo/hive-geoip 如何在Hive中利用udf?我可以自己创建函数名吗?

  • null 我将把所有三个文件转换成标准格式(文件1格式--一个有4列的输出)。要转换为标准格式,我需要引用文件第一行中的头记录。因此,如果我的输入文件是256MB,并且调用了多个映射器,是否有任何方法使每个映射器可以引用一个全局变量(头信息)。 简而言之,是否有一种方法为所有调用我的配置单元UDF的映射器提供一个公共变量? 注意:UDF将在单个列表上运行,读取完整的行,然后将其写入下一个表HDFS