当前位置: 首页 > 知识库问答 >
问题:

何时在Spark中使用map vs mapPartitions[重复]

宗乐池
2023-03-14

我知道mapmap分区之间的区别,它们分别针对元素和元素的迭代器。

我什么时候应该用哪个?如果开销是相似的,为什么我要使用mapPartitions,因为map更容易编写?

共有1个答案

欧阳玺
2023-03-14

RDD。map将函数映射到RDD的每个元素,而RDD。mapPartitions将函数映射到RDD的每个分区。

map不会改变RDD中元素的数量,而map分区很可能会这样做。

另请参见此答案和对类似问题的评论。

 类似资料: