当前位置: 首页 > 面试题库 >

map-reduce程序运行的时候会有什么比较常见的问题

卓瀚
2023-03-14
本文向大家介绍map-reduce程序运行的时候会有什么比较常见的问题相关面试题,主要包含被问及map-reduce程序运行的时候会有什么比较常见的问题时的应答技巧和注意事项,需要的朋友参考一下

比如说作业中大部分都完成了,但是总有几个reduce一直在运行

这是因为这几个reduce中的处理的数据要远远大于其他的reduce,可能是因为对键值对任务划分的不均匀造成的数据倾斜

解决的方法可以在分区的时候重新定义分区规则对于value数据很多的key可以进行拆分、均匀打散等处理,或者是在map端的combiner中进行数据预处理的操作

 类似资料:
  • 问题内容: 最近,我接受了公司的采访,他们给了我一个编码问题。我得到了与纸牌有关的程序,其中一种方法是将纸牌洗牌。因此,我将该程序编写为: 在上面的代码中,我引发了我最怀疑的 IllegalArgumentException 。在什么情况下实际上应该抛出运行时异常?我们是否应该实际抛出运行时异常? 谢谢 问题答案: 我们是否应该实际抛出运行时异常? 是的,我们应该。运行时异常有特定的用途-它们发出

  • 问题内容: 关于python 3.0中reduce()函数的更改以及如何删除它,网上似乎有很多热烈的讨论。我有点难以理解为什么会这样。我发现在各种情况下使用它是很合理的。如果蔑视仅仅是主观的,我无法想象会有这么多人关心它。 我想念什么?reduce()有什么问题? 问题答案: 正如Guido在Python 3000 帖子中的reduce()的命运中所说: 所以现在reduce()。实际上,这是我一

  • 我想对什么时候(忽略可用内存空间)存储比较结果而不是重新计算比较结果是有意义的有一个坚实的理解。什么是证明存储所产生的时间成本的临界点?是2次、3次还是4次比较?更多? 例如,在这种特殊情况下,哪个选项(通常)在速度方面会表现得更好? 备选办法1: 备选案文2: 我知道这没什么大不了的,大多数时候这种差异可以忽略不计。然而,我是一个完美主义者,我真的很想解决这个特殊的问题,这样我就可以继续我的生活

  • 我在java中运行mapreduce程序,它编译成功,但在运行时我使用的是EC2上的Hortonworks HDP2.0。 好心的帮助

  • Java 7更改了排序算法,从而抛出 java.lang.IllegalArgumentException:“比较方法违反了其总合同!” 在某些情况下,当使用的比较器有故障时。是否可以确定比较器中的哪种错误导致了这种情况?在我的实验中,如果x!=x,如果x也没有关系 (如果有一个通用的规则,在比较器中寻找bug可能会更容易。但是当然最好是修复所有的bug。:-) ) 特别是,以下两个比较器没有让T

  • 所以我正在学习Comparator和Comparable,我有以下问题。我有一门课: 另一个类Name实现了可比较的,在构造函数中有两个String。我不完全理解的是比较器的功能,我读过Java留档,我知道它用于对元素进行不同的排序,而不改变我的例子中的名称类它也可以在某些情况下允许空值,但是这个我的类构造函数中的声明工作正常,我根本不需要在PhoneBook类中实现比较器接口: 并实现了我希望它