当前位置: 首页 > 知识库问答 >
问题:

Hadoop字数组合器

曾承弼
2023-03-14
   public static class IntSumReducer extends Reducer<Text, IntWritable, Text,IntWritable> {

      public void reduce(Text key, Iterable<IntWritable> values, Context context) 
    throws IOException, InterruptedException {
       int sum = 0;
       for (IntWritable val : values) {
           sum += val.get();
       }
       context.write(key, new IntWritable(sum));
   }
  }
  <Java,1> <Virtual,1> <Machine,1> <Java,1>

它考虑第一个KV对并给出相同的输出...!!??因为我只有一个价值。为什么它同时考虑钥匙和制造

  <Java,1,1>  

既然我们考虑的是一次一对千伏?我知道这是一个错误的假设;请有人纠正我这一点

共有1个答案

洪宏硕
2023-03-14

IntSumReducer类继承了Reducer类和Reducer类,如果我们查看文档,它在这里执行魔术操作

“将共享键的一组中间值减少为一组较小的值。还原器实现可以通过JobContext.getConfiguration()方法访问作业的配置。

减速器有3个初级阶段:

程序调用同一类进行合并和约简操作;

job.setMapperClass(TokenizerMapper.class);
job.setCombinerClass(IntSumReducer.class);
job.setReducerClass(IntSumReducer.class);

所以我想出的是,如果我们只使用一个数据节点,我们不需要为这个wordcount程序调用combiner类,因为reducer类本身负责combiner工作。

job.setMapperClass(TokenizerMapper.class);
job.setReducerClass(IntSumReducer.class);

如果只使用一个数据节点,上述方法对wordcount程序也有同样的效果。

 类似资料:
  • 现在我正在编写一个 Java 程序,使用哈道普映射还原将输出写入 HBase。问题是关于合并器类的。因为现在我的 reduce 类扩展了 TableReducer,而不是化简器。那么我的合并器类呢,它应该也扩展表还原器,还是仍然扩展化简器?

  • 我仍在试图获得何时使用Hadoop combiner类的直觉(我看到了一些文章,但它们对我的情况没有特别的帮助)。 我的问题是,当组合器类的值为 Text 类时,使用组合器类是否合适?例如,假设我们有来自映射器的以下输出: 我们可以在这里应用一个组合器类吗? 在它到达减速器之前?

  • 这看起来很容易,但却不知道该怎么做。当前数组数据是按日期和日期列出的,因此我需要将所有日期组合起来:天、月、6个月、1年。我需要将数组数据排列为下面的第二个数组。

  • 我是hadoop的新手,刚刚安装了Hadoop2.6。 hadoop jar./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar grep/user/yoni/input/user/yoni/output101“dfs[a-z.]+” 以及在伪分布式模式下的设置,就像在所有的基本tutilies中一样

  • 问题内容: 尝试显示数组字符的每个组合而不重复字母时遇到问题。 上面的代码可以完美地工作,但是每个字母不能重复使用一次,在这种情况下不能这样做。 我被困在现在该怎么做。 问题答案: 这是一个示例实现。本质上,它需要一个String并遍历每个字符,然后将该字符放在最前面。然后,它在其余字符上递归。该结构消除了重复字母的问题,因为递归的输入已删除了您已经使用的字符。 我还将结果存储在一个集合中,以消除

  • 问题内容: 我有一个混合数组,需要按字母然后按数字排序 我如何将其排序为: 我努力了 但这只是按字母顺序排序。可以使用直接的JavaScript或jQuery完成此操作吗? 问题答案: