当前位置: 首页 > 知识库问答 >
问题:

在Apache Spark中将Dataframe的列值提取为列表

龙永福
2023-03-14

共有1个答案

颛孙铭
2023-03-14

这将返回包含单个列表的集合

dataFrame.select("YOUR_COLUMN_NAME").rdd.map(r => r(0)).collect()

没有映射,您只得到一个Row对象,它包含数据库中的每一列。

请记住,这可能会为您提供任何类型的列表。如果要指定结果类型,可以在r=>r(0).asinstanceof[YOUR_TYPE]映射中使用.asinstanceof[YOUR_TYPE]

 类似资料: