当前位置：首页 > 面试题库 >

Pyspark上saveAsTextFile（）中命令字符串异常中的（null）条目

曹高轩

2023-03-14

问题内容：

我正在Windows 7的Jupyter笔记本（Python 2.7）上的PySpark中工作。我有一个RDD类型，pyspark.rdd.PipelinedRDD称为idSums。尝试执行时idSums.saveAsTextFile(“Output”)，出现以下错误：

Py4JJavaError: An error occurred while calling o834.saveAsTextFile.
: org.apache.spark.SparkException: Job aborted due to stage failure: Task 1 in stage 33.0 failed 1 times, most recent failure: Lost task 1.0 in stage 33.0 (TID 131, localhost): java.io.IOException: (null) entry in command string: null chmod 0644 C:\Users\seride\Desktop\Experiments\PySpark\Output\_temporary\0\_temporary\attempt_201611231307_0033_m_000001_131\part-00001

我认为RDD对象应该没有任何问题，因为我能够执行其他操作而不会出错，例如，执行idSums.collect()会产生正确的输出。

此外，将Output创建目录（包含所有子目录）并part-00001创建文件，但该文件为0字节。

问题答案：

您缺少 winutils.exe hadoop二进制文件。取决于x64位/ x32位系统下载winutils.exe文件并设置您的hadoop home指向它。

第一种方式：

下载档案
hadoop在系统中创建文件夹，例如C:
bin在hadoop目录中创建文件夹，例如：C:\hadoop\bin
粘贴winutils.exe在bin，例如：C:\hadoop\bin\winuitls.exe
在系统属性的用户变量中->高级系统设置
创建新的变量名称：HADOOP_HOME 路径：C:\hadoop\

第二种方式：

您可以使用以下命令在Java程序中直接设置hadoop home：

System.setProperty("hadoop.home.dir","C:\hadoop" );

类似资料：

字符串中的空指针异常

我得到一个空指针异常在我的code.Please帮我解决它。这是我的代码。这是我的原木猫。第138行为点击法-
在pyspark中按行串联字符串

问题内容：我有一个pyspark数据框为并且需要按行连接患者姓名，以便获得如下输出：有人可以帮我有关在pyspark中创建此数据框吗？提前致谢。问题答案：我能想到的最简单的方法是使用
pyspark中列名的字符串操作

这篇文章给出了一个关于如何更改列名的很好的概述。如何在PySpark中更改dataframe列名？不过，我需要一些更多的/稍微调整，我没有能力做。有人能帮我删除所有colnames中的空格吗？它需要例如连接命令，系统方法减少了处理30列的工作量。我认为regex和UDF的组合最好。示例：root--客户机：string（nullable=true）--分支号：string（nullable=t
使用pyspark的rdd中的子字符串

我不是RDD方面的专家，正在寻找一些答案，我试图在pyspark RDD上执行一些操作，但无法实现，特别是子串。我知道我可以通过将RDD转换为DF来做到这一点，但想知道在DF时代之前是如何做到这一点的？公司仍然更喜欢在RDD或数据帧中工作吗？我的代码：数据样本：完整的错误消息： org.apache.spark.SparkException：由于阶段失败而中止作业：阶段50.0中的任务0失败
从JSON字符串中检索null和非null字符串值

我有一个正在解析的JSON字符串，我想检索字段“pr_num”的值。我收到这个错误：我的代码如下：我想获取字段的值，它们是690052和null。 jsonString如下所述
Android引发异常中的字符串到JSONObject

下面是String object中的JSON格式，我试图将其转换为Android中的JSONObject。我把它复制到JSON美化器，它说它是一个有效的JSON。但这引发了例外。JSON格式有什么问题吗？使用的代码是：异常StackTrace：

相关阅读

级联字符串中的条件运算符在Python程序中串接不常见字符的字符串 Null字符串连接从Java中的字符串数组中删除Null值 Pyspark数据框上的数据透视字符串列

相关文章

Selenium WebDriver常用命令 C语言标准库中的字符串 Python去除字符串中空格字符串指针（指向字符串的指针）8.0 Zookeeper 四字命令

相关问答

字符串定义中的条件 avro架构中的问题..字符串,null 用cURL命令中的变量替换字符串[重复]在java中解析字符串时出现异常字符串类型的数字格式异常

相关工具

《Redis 命令参考》活字格 - 设计器设置焦点命令插件 null jQuery异步上传插件 Null-modem emulator

相关文档

Redis 常用命令 PySpark 中文教程 Git 命令大全中文版命令行的艺术 Go 命令教程