当前位置: 首页 > 知识库问答 >
问题:

在Apache Spark中mapPartitions和ForeachPartition之间的区别是什么

徐飞尘
2023-03-14

我有一个数据框,其中一列是逗号分隔的数据。

例如:数据如下所示:[{value:1},{value:2,value:3},{some value},{somevalue,othervalue}]

列是字符串数据类型。我想将其转换为列表并应用一些函数。现在我有一个函数来完成字符串列到列表的转换

但是哪个功能更好呢

共有1个答案

颛孙飞
2023-03-14

区别就像地图和Foreach之间的区别一样。在这里寻找好的解释——Foreach和map之间有区别吗?。

mapPartitions和foreachPartitions是应用于数据帧的每个分区而不是每个元素的转换/操作。请参见此处,以获取对比map和mapPartitions的解释-Apache Spark:map vs mapPartitions?。

根据你的描述,听起来你要么想要地图,要么想要foreach。

 类似资料:
  • 在Java 7之前,JVM内存中有一个名为PermGen的区域,JVM以前在这里保存它的类。在Java 8中,它被移除并被称为元空间的区域所取代。 PermGen和Metaspace之间最重要的区别是什么? 我知道的唯一区别是,并且忽略了VM参数。

  • 和之间有什么区别? 是什么原因导致他们被扔?如何解决这些问题? 在修改现有代码以包含新的jar文件时,我经常会遇到这些可抛物。我在通过WebStart发布的一个Java应用程序的客户端和服务器端都碰到了它们。 我遇到的可能原因是: 代码客户端的中未包含的包 我们正在使用的新JAR缺少运行时类路径 版本与以前的JAR冲突 当我今天遇到这些问题时,我会采取跟踪和错误的方法来使事情正常工作。我需要更多的

  • 当我试图在Spring4.x上进行测试时,我使用了MockMvc web客户端,但我正在阅读和尝试Spring5.x的新特性。 我认为,WebTestClient和MockMvc是相同或非常相似的。 MockMvc和WebTestClient之间的区别是什么?

  • 有人能给我解释一下map和flatMap之间的区别,以及什么是各自的好用例吗? “结果扁平化”是什么意思?它有什么好处?

  • 给定以下从静态编程语言Koans中提取的代码: 我自己的解决方案使用了。两者都适用于koan场景。 和的文档似乎非常相似。 这两个功能有什么区别?