问题：

Hadoop给了减缩器什么？

宁锐

2023-03-14

在实验了2个reducer之后，阅读了Hadoop Wiki中的HowManyMapsAndReduces,Hadoop：reducer的数量保持不变，并且设置了映射任务和reduce任务的数量，我得到的结论是：

如果我有1个map（我知道这个数字实际上是由Hadoop决定的）和2个reducer（实际上我只提供了1个带有reducer代码的文件，例如-reducer/bin/wc)，那么下面会发生什么？

null

我想第一个选择，但我在网上找不到证据。

共有1个答案

左丘季

2023-03-14

选项1a:Hadoop会将数据分配给精简器，但它可能不会平均分配数据。平衡是不能保证的，特别是如果（1）您的密钥分布是倾斜的或（2）没有很多记录。

类似资料：

Hadoop:映射器和缩减器的数量

我在1.1GB文件上运行Hadoop MapReduce多次，使用不同数量的映射器和化简器（例如，1个映射器和1个化简器，1个映射器和2个化简器，1个映射器和4个化简器，...） Hadoop安装在具有超线程的四核机器上。以下是按最短执行时间排序的前 5 个结果： 1 - 8 个化简器和 1 - 8 个映射器的结果：列 = 映射器行数 = 化简器数（1）当我有8个映射器时，程序运行速度似乎稍快
Hadoop 映射缩减代码的前 N 个值

我是hadoop领域的新手，正在努力完成一个简单的任务。有人能告诉我如何仅使用Map duce代码技术来获取字数示例的前n个值吗？我不想为这个简单的任务使用任何hadoop命令。
什么给了java.lang.NoClassDefFoundError？

}
如何在Hadoop中的运行时确定任务是缩减器还是合并器？

如果使用MapReduce执行的操作不是可交换和关联的，则组合器不能与还原器相同。例如，当计算平均值时，组合器对键的值求和，减法器求和，然后将和除以该键的值总数。组合器的代码只有一点修改。如果您可以将同一个类用于组合器和减速机，并拥有一个可以确定当前任务是组合器还是减速机的代码库，会怎么样？如果它发现它是一个减法器，则它将总和除以计数。大概是这样的: 这样做可能吗？上面的代码< code>TH
如何在hadoop减速器中编写int值

我正在用Hadoop写一个mapreduce。在reduce方法中，我想用context.write()。但是输出是int类型。我该怎么做？当我使用context.write()时，它显示一个错误: 第二个参数不能是int。这是我的代码：这个减少计算一些东西。然后它应该写键和计数变量。我该怎么做？答复我找到了我的答案。我应该新建一个IntWritable类并使用它的方法(set(intV
Hadoop流媒体“cat”和“wc”示例——“cat”映射器和“wc”缩减器实际上是如何工作的

我的问题是。Apache Hadoop在其文档中提到了以下一个Hadoop流的示例代码：现在我向这个流媒体提供一个文本文件。假设，文本文件只包含以下两行： hadoop流媒体命令工作得很好，没有问题。但我无法回答以下问题，尽管我在网上多次阅读了上述链接材料和其他例子。假设只有一个映射器和一个减速机：据我所知，Mapper获取（键、值）对作为输入。在上述两行中，什么是关键，什么是价值我知道这

Hadoop给了减缩器什么？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档