当前位置: 首页 > 知识库问答 >
问题:

PIG--在组函数之后定义用于包的分隔符

谢骏奇
2023-03-14

在Pig中,我正在加载和分组两个文件。我最终得到了这样的结果:

A = LOAD 'File1' Using PigStorage('\t');
B = LOAD 'File2' Using PigStorage('\t');
C = COGROUP A BY $0, B BY $0;
STORE C INTO 'Output' USING PigStorage('\t');

产出:

123 {(123,XYZ,456)} {(123,QRS,889,QWER)}
123 {(123\tXYZ\t456)} {(123\tQRS\t889\tQWER)}

共有1个答案

扶绍辉
2023-03-14

这似乎是一个开放的问题(截至2013年6月)在猪。有关更多细节,请参见相应的JIRA。在问题解决之前,您可以更改输入数据。

 类似资料:
  • 我正试图在GoogleSheets中创建一个自定义函数,用于搜索列范围中的特定值,如果该值为true,则返回true。我已经测试了该函数,在脚本编辑器中运行时效果很好,但是当我尝试在Google sheets中使用它时,它不起作用。 当我定义array参数时,函数运行良好,但当我尝试将googlesheets中的一个范围作为数组传递时,函数总是返回false。这是我第一次使用Javascript/

  • 函数表达式 函数表达式是JavaScript中既强大又容易让人困惑的特性。 函数的定义 函数的定义有两种方式:函数声明 和 函数表达式。 函数声明 函数声明的语法: function functionName () { //函数体 } function是关键字,后面跟着的是函数的名字,这就是指定函数名的方法。谷歌、火狐、苹果、欧朋等浏览器给函数定义了一个非标准的name属性,它的值 等于

  • 本文向大家介绍Python闭包函数定义与用法分析,包括了Python闭包函数定义与用法分析的使用技巧和注意事项,需要的朋友参考一下 本文实例分析了Python闭包函数定义与用法。分享给大家供大家参考,具体如下: python的闭包 首先python闭包的作用,一个是自带作用域,另一个是延迟计算。 闭包是装饰器的基础。 闭包的基本形式: 需要注意的是: 函数的作用域关系在函数定义阶段就已经固定,与调

  • 我将立即承认我是一个java开发人员,正在寻找一个类似于DecimalFormat的函数,类似于: 代码改编自Oracle javase i18n 我能找到的与此相关的每个资源要么只是格式化(而不是解析) 如何为Angular 4中的数字管道指定千位分隔符 NativeScript:格式化数字类型脚本 或者人们使用正则表达式替换(这在我看来很疯狂) 如何将带有逗号千分隔符的字符串解析为数字? 或一

  • 问题内容: 我目前正在阅读John Papa的AngularJS样式指南,并看到了以下代码: 您可以看到函数和是 在 函数返回值 之后 定义的。这是如何运作的?它是否符合标准并且可以在所有浏览器中使用(例如,来自IE 6)? 问题答案: 您可以看到函数和是在函数返回值之后定义的。 那是从它们的编写位置看的样子,是的,但是实际上它们是在函数中的任何分步代码完全运行之前定义的。有时这被称为“提升”函数

  • 问题内容: 我有一个包含JSON对象的表。每个JSON对象在方括号中均包含一个数组,并用逗号分隔。 如何使用SQL访问方括号数组中的任何元素,例如“ Matt”? 我在Hadoop上使用“ Hive”。如果您知道如何在SQL中执行此操作,那很好:) 问题答案: 您可以在Hive中执行以下操作: 首先,您需要一个JSON SerDe(Serializer / Deserializer)。我见过的最实