当前位置: 首页 > 知识库问答 >
问题:

pyspark AttributeError:“DataFrame”对象没有属性“to df”

林修雅
2023-03-14

下面的代码以前对我有用,但现在不行了。我得到了错误:

AttributeError:“DataFrame”对象没有属性“to df”

if __name__ == "__main__":
  sc = SparkContext(appName="test")
  sqlContext = SQLContext(sc)

  df = sqlContext.read.format('com.databricks.spark.csv').\
    options(header='false',delimiter=',',inferSchema='true').load('test')

  ### rename columns
  df = df.toDF('a','b','c')
  ...
  sc.stop()

共有1个答案

百里金林
2023-03-14

我想通了。看起来和我们的spark版本有关。它与1.6一起工作

 类似资料:
  • 问题内容: 我在这里遇到一些问题,在我的python包中,我已经安装了numpy,但是我仍然 遇到 此错误 ‘DataFrame’对象没有属性’sort’ 任何人都可以给我一些想法。 这是我的代码: 问题答案: 不推荐使用DataFrames,而采用以下两种方法之一: 到 由列排序(S) 要 通过索引排序 在Pandas中已弃用(但仍可用)版本0.17(2015-10-09),并引入和。它已从0.

  • 我在这里遇到了一些问题,在我的python包中,我安装了,但是我仍然有这个错误: “DataFrame”对象没有属性“sort” 任何人都可以给我一些想法。。 这是我的代码:

  • 问题内容: 我想转换火花数据框架以使用以下代码添加: 详细的错误消息是: 有人知道我在这里做错了吗?谢谢! 问题答案: 您无法使用数据框,但可以将数据框转换为RDD并通过映射将其映射。在Spark 2.0之前,别名为。使用Spark 2.0,您必须先明确调用。

  • 当我尝试使用时,出现此错误。用于拉出列的数据帧的ix属性,例如。 这个脚本今天早上还能用,但是今天下午我在一个新的Linux环境中运行了它,安装了新的熊猫。以前有人见过这个错误吗?我找遍了这里和其他地方,但没找到。

  • 问题内容: 我正在尝试过滤出包含产品列表的数据框。但是,我遇到了熊猫-每当我运行代码时,“ dataframe”对象都没有属性“ str”错误。 这是代码行: 如果有人有任何建议的想法,请告诉我。我已经搜索了很多次,而且非常困惑。 产品是对象数据类型。 编辑: 这是头: 编辑2:这是print(data),A是产品。当我将其打印出来时,看起来好像A不在类别产品下。 问题答案: 答案很简单: 改变成

  • 我有一些关于S3 bucket的数据要处理。 我已经导入它使用: 我可以看到数据已使用以下方法正确导入: 但是当我尝试简单的操作时(取自此dask文档): 我有个错误: () 1列车搅拌=列车[列车['CON\U搅拌声明']==1] ---- ~/anaconda3/envs/python3/lib/python3。6/现场包/dask/基地。计算中的py(自,**kwargs)152 dask。