当前位置: 首页 > 知识库问答 >
问题:

如何创建DataFrame:列数不匹配

吴嘉禧
2023-03-14

在此代码中:

val columnNames = """'srcId', 'srcLabel', 'dstId', 'dstLabel'"""

import spark.sqlContext.implicits._

var df = Seq.empty[(String, String, String, String)]
  .toDF(columnNames)

共有1个答案

谢翰学
2023-03-14

您的方法的问题是columnnames是一个字符串,而您已经定义了tuple4空字符串。因此,必须将columnnames字符串拆分为四个字符串并传递给todf

正确的方法是如下所示

val columnNames = """'srcId', 'srcLabel', 'dstId', 'dstLabel'"""

var df = Seq.empty[(String, String, String, String)]
  .toDF(columnNames.split(","): _*)

它应该为您提供一个空的dataframe

+-------+-----------+--------+-----------+
|'srcId'| 'srcLabel'| 'dstId'| 'dstLabel'|
+-------+-----------+--------+-----------+
+-------+-----------+--------+-----------+
 类似资料:
  • 今天下午,我一直在努力寻找一种方法,通过检查熊猫名字(标签?)中某个模式的出现,来选择我的熊猫数据目录中的几列。 (当然,可以应用任何函数) 然后,我找到了函数,并让它使用以下代码: 当然,在第一个解决方案中,我可以执行相同类型的regex检查,因为我可以将它应用于迭代返回的数据类型。

  • 问题内容: 我有下面的数据框: 我想向数据框添加另一列(或生成一系列),该列与数据框的长度相同,如果Set =’Z’则将颜色设置为green ,如果. 最好的方法是什么? 问题答案: 如果你只有两种选择: 例如, 输出 如果你有两个以上的条件,请使用。例如,如果你想成为 when otherwise when otherwise when otherwise , 然后使用 输出:

  • 做这件事最好的方法是什么?

  • 问题内容: 我有一个由列表列表组成的Numpy数组,代表带有行标签和列名的二维数组,如下所示: 我希望所得的DataFrame将Row1和Row2作为索引值,并将Col1,Col2作为标头值 我可以指定索引如下: 但是我不确定如何最好地分配列标题。 问题答案: 您需要指定,并以构造函数,如: 编辑 :如@joris注释中所示,您可能需要更改上述内容才能具有正确的数据类型。

  • 下面是我的代码: 我想用一个新的测试列创建一个空的dataframe,该列是空的,并调用“exp”