我正在学习“学习Pyspark”教程(在此链接)。当我跑的时候
selector = ft.ChiSqSelector(4).fit(births_train)
s1 = births_train.map(lambda row: row.label)
s2 = selector.transform(births_train.map(lambda row: row.features))
print(s1.take(1))
print(s2.take(1))
print(type(s1))
print(type(s2))
我有这样的输出:
s3=s1.zip(s2)
print(type(s3))
print(s3.collect())
<类“pyspark.rdd.rdd”>
----------------------------------------------------------------Py4JJavaError Traceback(最近调用last)in()1 s3=s1.zip(s2)2 print(type(s3))------>3 print(s3.collect())
/content/spark-2.3.1-bin-hadoop2.7/python/pyspark/rdd.py在collect(self)832“”833中使用SCCallSiteSync(self.context)作为CSS:-->834 sock_info=self.ctx._jvm.pythonrdd.collectandserve(self._jrdd.rdd())835返回列表(_load_from_socket(sock_info,self._jrdd_deserializer))836
/content/spark-2.3.1-bin-hadoop2.7/python/lib/py4j-0.10.7-src.zip/py4j/java_gateway.py in call(self,*args)1255应答=self.gateway_client.send_command(command)1256 return_value=get_return_value(->1257应答,self.gateway_client,self.target_id,self.name)1258 1259对于temp_args中的temp_arg:
/content/spark-2.3.1-bin-hadoop2.7/python/pyspark/sql/utils.py in deco(*a,**kw)61 def deco(*a,**kw):62 try:---->63返回f(*a,**kw)64除py4j.protocol.py4jJavaError为E:65 s=e.java_exception.toString()
/content/spark-2.3.1-bin-hadoop2.7/python/lib/py4j-0.10.7-src.zip/py4j/protocol.py in get_return_value(应答,gateway_client,target_id,name)326引发Py4JJavaError(327“调用{0}{1}{2}时出错.\n”。-->328格式(target_id,“.”,name),value)329 else:330引发Py4JError(
PY4JJavaError:调用z:org.apache.spark.api.python.pythonrdd.CollectAndServe时出错。:sparkException:作业由于阶段失败而中止:阶段308.0中的任务0失败了1次,最近失败:stage 308.0中丢失的任务0.0(TID 8596,本地主机,执行器驱动程序):org.apache.spark.api.python.pythonException:追溯(最近一次调用):文件“/content/spark-2.3.1-bin-hadoop2.7/python/lib/pyspark.zip/pyspark/worker.py”,第230行,在主进程中()文件“/content/spark-2.3.1-bin-hadoop2.7/python/lib/pyspark.zip/pyspark/worker.py”,第225行,在进程75,返回lambda*a:f(*a)文件“/content/spark-2.3.1-bin-hadoop2.7/python/pyspark/util.py”,第55行,在wrapper返回f(*args,**kwargs)文件“”,第9行,在recode keyerror:“1”中
为什么?
下面的代码对我起作用,虽然我不知道为什么:
truth = sc.parallelize(births_test.map(lambda row: row.label).collect())
prediction = sc.parallelize(LR_Model.predict(births_test.map(lambda row: row.features)).map(lambda x: x * 1.0).collect())
LR_results = truth.zip(prediction)
本文向大家介绍Android学习教程之圆形Menu菜单制作方法(1),包括了Android学习教程之圆形Menu菜单制作方法(1)的使用技巧和注意事项,需要的朋友参考一下 本文实例为大家分享了Android圆形菜单的使用方法,供大家参考,具体内容如下 MainActivity.java代码: activity_main.xml内容: CirclemenuActivity.java代码: Circl
本文向大家介绍Axios学习笔记之使用方法教程,包括了Axios学习笔记之使用方法教程的使用技巧和注意事项,需要的朋友参考一下 前言 最近正在学习Axios,相信大家都知道Axios 是一个基于 promise 的 HTTP 库,可以用在浏览器和 node.js 中。所以本文将详细介绍关于Axios使用方法的相关内容,分享出来供大家参考学习,下面话不多说,来一起看看详细的介绍: Axios Git
本文向大家介绍java8学习教程之lambda表达式的使用方法,包括了java8学习教程之lambda表达式的使用方法的使用技巧和注意事项,需要的朋友参考一下 前言 我们在 上一篇文章 中介绍了 lambda 表达式的语法,引入了 lambda 表达式的使用场景,以及使用 lambda 表达式的好处。我们将在这篇文章中,已实例讲解如何定义和使用 lambda 表达式,以及与其它语言相比,lambd
本文向大家介绍ASP.NET MVC学习教程之Razor语法,包括了ASP.NET MVC学习教程之Razor语法的使用技巧和注意事项,需要的朋友参考一下 前言 ASP.NET MVC 3配有一个新的名为“Razor”的视图引擎选项(除了已有的.aspx视图引擎)。Razor尽量减少编写一个视图模板需要敲入的字符数,实现快速流畅的编程工作流。与大部分模板的语法不同,你不必在HTML中为了明确地标记
本文向大家介绍Python 学习教程之networkx,包括了Python 学习教程之networkx的使用技巧和注意事项,需要的朋友参考一下 networkx是Python的一个包,用于构建和操作复杂的图结构,提供分析图的算法。图是由顶点、边和可选的属性构成的数据结构,顶点表示数据,边是由两个顶点唯一确定的,表示两个顶点之间的关系。顶点和边也可以拥有更多的属性,以存储更多的信息。 对于netwo
本文向大家介绍kotlin 官方学习教程之基础语法详解,包括了kotlin 官方学习教程之基础语法详解的使用技巧和注意事项,需要的朋友参考一下 kotlin 官方学习教程之基础语法详解 Google 在今天的举行了 I/O 大会,大会主要主要展示内有容 Android O(Android 8.0)系统、Google Assistant 语音助手、Google 智能音箱、人工智能、机器学习、虚拟现实