在此代码中:
val columnNames = """'srcId', 'srcLabel', 'dstId', 'dstLabel'"""
import spark.sqlContext.implicits._
var df = Seq.empty[(String, String, String, String)]
.toDF(columnNames)
您的方法的问题是columnnames
是一个字符串,而您已经定义了tuple4
空字符串。因此,必须将columnnames
字符串拆分为四个字符串并传递给todf
正确的方法是如下所示
val columnNames = """'srcId', 'srcLabel', 'dstId', 'dstLabel'"""
var df = Seq.empty[(String, String, String, String)]
.toDF(columnNames.split(","): _*)
它应该为您提供一个空的dataframe
+-------+-----------+--------+-----------+
|'srcId'| 'srcLabel'| 'dstId'| 'dstLabel'|
+-------+-----------+--------+-----------+
+-------+-----------+--------+-----------+
今天下午,我一直在努力寻找一种方法,通过检查熊猫名字(标签?)中某个模式的出现,来选择我的熊猫数据目录中的几列。 (当然,可以应用任何函数) 然后,我找到了函数,并让它使用以下代码: 当然,在第一个解决方案中,我可以执行相同类型的regex检查,因为我可以将它应用于迭代返回的数据类型。
问题内容: 我有下面的数据框: 我想向数据框添加另一列(或生成一系列),该列与数据框的长度相同,如果Set =’Z’则将颜色设置为green ,如果. 最好的方法是什么? 问题答案: 如果你只有两种选择: 例如, 输出 如果你有两个以上的条件,请使用。例如,如果你想成为 when otherwise when otherwise when otherwise , 然后使用 输出:
做这件事最好的方法是什么?
问题内容: 我有一个由列表列表组成的Numpy数组,代表带有行标签和列名的二维数组,如下所示: 我希望所得的DataFrame将Row1和Row2作为索引值,并将Col1,Col2作为标头值 我可以指定索引如下: 但是我不确定如何最好地分配列标题。 问题答案: 您需要指定,并以构造函数,如: 编辑 :如@joris注释中所示,您可能需要更改上述内容才能具有正确的数据类型。
下面是我的代码: 我想用一个新的测试列创建一个空的dataframe,该列是空的,并调用“exp”