我面临一个棘手的问题。我用最新版本的cygwin在windows7/64位机器上运行PIG 0.11。
我是一个博客,我想按用户名排序,将同一用户的所有用户活动放在一起,以供下一行处理。
我正在启动commandprompt-
脚本是:
USERACTIVITIES = LOAD '/D:/path/of/logs/useractivities' USING org.apache.pig.piggybank.storage.CSVExcelStorage(',') AS (datetimeUnProcessed:chararray, username:chararray, request:chararray);
USERACTIVITIES_ORDERED = ORDER USERACTIVITIES by username;
STORE USERACTIVITIES_ORDERED INTO '/D:/readyfornextinput/useractivities' USING org.apache.pig.piggybank.storage.CSVExcelStorage(',');
当我演示USERACTIVITIES_ORDERED时,我看到它进展顺利。但当我储存/倾倒垃圾时,我会面临一个棘手的问题。
它失败了,说:java。lang.RuntimeException:org。阿帕奇。hadoop。mapreduce。lib。输入InvalidInputException:输入路径不存在:文件:/D:/pigsample\u 1749383998\u 1377684507424
当我试图搜索这个pigsample\u编号文件时,我可以在:D:/tmp//mapred/local/localRunner中找到它
我不知道这是怎么发生的。我不确定它是否与windows/cygwin相关,或者有人在Linux上也看到了这一点。
作为参考,您可以在此处找到stacktrace:
2013-08-28 15:38:28,863[Thread-46]WARNjob_local_0004LocalJobRunner-ask.java:370pigsample_1749383998_1377684507424RuntimeException:pigsample_1288777582_1377684802262InvalidInputException:输入路径不存在:file:/D:/org.apache.hadoop.mapred.在unner.java:214减少org.apache.hadoop.mapreduce.lib.input.WeightedRangePorg.apache.hadoop.mapreduce.lib.input.Conf(WeightedRangePormat.list)在ormat.java:235反射org.apache.pig.backend.hadoop.executionengine.mapConf(反射ormat.list)在org.apache.hadoop.util.反射tils.new实例(反射tils.java:117)在org.apache.hadoop.mapred.Map任务$NewOutputCollector。(MapTask.java:677)在org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:756)在org.apache.hadoop.mapred.MapTask.run(MapTorg.apache.hadoop.mapred.)在java.lang.LocalJobRunner$Job.run(LocalJobRorg.apache.pig.backend.hadoop.executionengine.map)由:ayer.partitioners.InvalidInputException:输入路径不存在:file:/D:/org.apache.hadoop.mapreduce.lib.input.在artitioner.setFileInputFartitioner.java:157状态(FileInputForg.apache.hadoop.util.)在tils.set减少层。PigFileInputFtils.java:62状态(PigFileInputF
这方面的任何帮助都会很有用。
看起来这只能在cygwin环境下再现。我在这里记录了根本原因和解决方案
问题内容: 我想从各种目录中读取日志文件,例如:… 具有子目录… 分别在这些子目录中。 所以我正在考虑读取这样的文件: 但是,我很难过滤它们,即要知道对于哪个服务器()和日志类型(),我必须应用以下模式: 例如:我想做这样的事情 上面是用于日志文件(不是cronLog目录)。但是,这样的我也想过滤器上的每个服务器都会有,等日志。 如何同时过滤? 有没有办法从输入中获取目录名称?从这里喜欢 我应该如
当我尝试运行或调试时,android Studio 1.3.2显示为“本地路径不存在”,设备名称也没有apk文件,构建文件夹Gradle-2.4 Gradle plugin-1.3 注意:我从eclipse导入了这个项目 编辑:我解决了这个问题。。现在,新的一个是“无法在dexpath类中找到mainactivity” 但是第1类。dex和Class 2。生成dex
问题内容: 我目前正在开发一个Spring Batch,它可以在第一步中将Excel(.xsls)文件转换为CSV,然后读取CSV,对其进行处理并将其数据存储在数据库中。第一步效果很好。批处理在第二步停止,并发出以下警告:。在我的代码之后: spring-config.xml: 第1步-convertXLSXtoCVS.java: 我在属性文件中提到了文件路径,如下所示: 当我在阅读器定义中从sp
我将multer添加到我的node js应用程序中,它工作得很好,只是我需要存储在db中的图像的路径不正确。找不到问题所在,显然是我犯了个愚蠢的错误。 这是我为multer做的准备 下面是我如何使用它来存储路径 你可以从这里看到路径不对,我不能在GET上使用它
问题内容: 这个问题已经在这里有了答案 : 7年前关闭。 可能重复: 使用jQuery输入文件的完整路径 我有以下html元素 如果我用 我只是文件名,而不是文件的完整绝对路径。有人可以告诉我如何获得完整路径吗? 问题答案: 您不能这样做-由于安全问题,浏览器将不允许这样做。尽管有解决方法,但事实是您不应该依靠这种方法。以下堆栈溢出问题与此处相关: 使用jquery输入文件的完整路径 如何从Fir
当我在我连接的设备上运行应用程序时,选择设备后显示意外错误,本地路径不存在。