如何创建DataFrame：列数不匹配

吴嘉禧

2023-03-14

在此代码中：

val columnNames = """'srcId', 'srcLabel', 'dstId', 'dstLabel'"""

import spark.sqlContext.implicits._

var df = Seq.empty[(String, String, String, String)]
  .toDF(columnNames)

共有1个答案

谢翰学

2023-03-14

您的方法的问题是columnnames是一个字符串，而您已经定义了tuple4空字符串。因此，必须将columnnames字符串拆分为四个字符串并传递给todf

正确的方法是如下所示

val columnNames = """'srcId', 'srcLabel', 'dstId', 'dstLabel'"""

var df = Seq.empty[(String, String, String, String)]
  .toDF(columnNames.split(","): _*)

它应该为您提供一个空的dataframe

+-------+-----------+--------+-----------+
|'srcId'| 'srcLabel'| 'dstId'| 'dstLabel'|
+-------+-----------+--------+-----------+
+-------+-----------+--------+-----------+

类似资料：

如何创建regex匹配流？
如何基于部分匹配选择DataFrame列？

今天下午，我一直在努力寻找一种方法，通过检查熊猫名字（标签？）中某个模式的出现，来选择我的熊猫数据目录中的几列。（当然，可以应用任何函数）然后，我找到了函数，并让它使用以下代码：当然，在第一个解决方案中，我可以执行相同类型的regex检查，因为我可以将它应用于迭代返回的数据类型。
Pandas条件创建series/dataframe列

问题内容：我有下面的数据框：我想向数据框添加另一列（或生成一系列），该列与数据框的长度相同，如果Set =’Z’则将颜色设置为green ，如果. 最好的方法是什么？问题答案：如果你只有两种选择：例如，输出如果你有两个以上的条件，请使用。例如，如果你想成为 when otherwise when otherwise when otherwise , 然后使用输出：
Pandas条件创建Series/DataFrame列

做这件事最好的方法是什么？
从Numpy数组创建Pandas DataFrame：如何指定索引列和列标题？

问题内容：我有一个由列表列表组成的Numpy数组，代表带有行标签和列名的二维数组，如下所示：我希望所得的DataFrame将Row1和Row2作为索引值，并将Col1，Col2作为标头值我可以指定索引如下：但是我不确定如何最好地分配列标题。问题答案：您需要指定，并以构造函数，如：编辑：如@joris注释中所示，您可能需要更改上述内容才能具有正确的数据类型。
如何在R[duplicate]中的空dataframe中创建新列

下面是我的代码：我想用一个新的测试列创建一个空的dataframe，该列是空的，并调用“exp”

如何创建DataFrame：列数不匹配

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档