问题：

这个Java for HDInsight Hadoop有什么问题吗？

程胡非

2023-03-14

import java.io.IOException;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.util.ToolRunner;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.Mapper.Context;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;

public class PageStat implements Tool {
private Configuration conf;

@Override
public int run(String[] args) throws Exception {
    Job job = new Job(getConf());
    String jobName = "Page visit statistics MR";
    job.setJobName(jobName);

    job.setJarByClass(PageStat.class);

    FileInputFormat.addInputPath(job, new Path(args[0]));
    FileOutputFormat.setOutputPath(job, new Path(args[1]));

    job.setMapperClass(PageStat.PageStatMapper.class);
    job.setReducerClass(PageStat.PageStatReducer.class);

    job.setMapOutputKeyClass(Text.class);
    job.setMapOutputValueClass(IntWritable.class);

    job.setOutputKeyClass(Text.class);
    job.setOutputValueClass(IntWritable.class);

    job.setNumReduceTasks(job.getConfiguration().getInt("num.reducer", 1));

    int status =  job.waitForCompletion(true) ? 0 : 1;
    return status;
}

public static void main(String[] args) throws Exception {
    int exitCode = ToolRunner.run(new PageStat(), args);
    System.exit(exitCode);
}

public void setConf(Configuration conf) {
   this.conf = conf;
}

public Configuration getConf() {
    return conf;
}

public static class PageStatMapper extends Mapper<LongWritable, Text, Text, IntWritable> {
    private Text keyHolder = new Text();
    private IntWritable valueHolder = new IntWritable();

    @Override
    protected void map(LongWritable key, Text value, Context context)
        throws IOException, InterruptedException {
        String[] items  =  value.toString().split(",");
        if (items.length == 3) {
            String url = items[1];
            keyHolder.set(url);
            Integer duration = Integer.parseInt(items[2]);
            valueHolder.set(duration);
            context.write(keyHolder, valueHolder);
        } else {
            context.getCounter("Error", "invalidData").increment(1);
        }
    }        
}   

public static class PageStatReducer extends Reducer<Text, IntWritable, Text, IntWritable> {
    private Text keyHolder = new Text();
    private IntWritable valueHolder = new IntWritable();
    private String statType;
    private int count;
    private int totalTime;
    private int avTime;

    protected void setup(Context context) throws IOException, InterruptedException {
        Configuration conf = context.getConfiguration();
        statType = conf.get("page.stat");
    }

    protected void reduce(Text key, Iterable<IntWritable> values, Context context)
    throws IOException, InterruptedException {
        count = 0;
        totalTime = 0;
        for (IntWritable value : values){
            ++count;
            totalTime += value.get();
        } 
        avTime = totalTime / count;

        keyHolder.set(key);
        if (statType.equals("average")){
            valueHolder.set(avTime);
        } else {
            valueHolder.set(totalTime);
        }
        context.write(keyHolder, valueHolder);
    }
}    

}

谢谢！！！

共有1个答案

柳飞鸾

2023-03-14

我遇到了一个类似的问题，您需要使用-d标志来执行：

-Dpage.stat=total

您可能会看到一个错误：

log4j:WARN No appenders could be found for logger (org.apache.hadoop.hdfs.DFSClient).
log4j:WARN Please initialize the log4j system properly.

这还不是全部答案，我自己还在查个水落石出。

类似资料：

这个clone（）有什么问题？

问题内容：我已经为Employee类的父类是抽象的并且父类中的clone（）方法是抽象的编写了此克隆方法。我想用此代码复制Employee对象的原始数据类型，而不是复制每个原始数据单独键入，但是此代码在我调用clone（）方法的行中有问题。（此代码在Employee类中）错误是：来自对象类型的方法clone（）不可见。但是我的Employee类在类层次结构中，可以访问Object类中受保护的
这个堆栈有什么问题？

我有一个关于书库的问题...我想写一个有3个堆栈的程序，我想在每个堆栈上添加这些操作（我应该使用数组）： 1.创建堆栈2。按3号。流行音乐4号。显示每个堆栈的顶部我写的程序，但我遇到了这些错误：错误4错误LNK2019:未解析的外部符号“public:int\u thiscall stack:：IsFull2（void）”（？IsFull2@stack@@QAEHXZ）在函数“public:v
这个GraphQL查询有什么问题？

我是GraphQL的新手，我正试图做一个突变来从我的数据库中删除一篇文章，但我不知道如何删除。我使用Node.js，猫鼬和GraphQL。这是我的模式的变异。这是我在调用API删除文章时使用的查询。我做错了什么？我收到一个错误的400请求。消息：“无法查询类型为“变异”的字段“删除”
这个AWS cron ScheduleExpression有什么问题？

尝试在每周一8:15运行时间表，我尝试了以下表达式：我想这意味着：分钟数：15 小时：8 月日：每隔月份：每星期几：仅周一年份：每文件：http://docs.aws.amazon.com/AmazonCloudWatch/latest/events/ScheduledEvents.html
这xml有什么问题？

提示：Extra content at the end of the document这样的错误
这个go switch语句有什么问题？

问题内容：谁能看到为什么此开关不起作用？在此语句中，始终返回默认值，但是在对switch表达式进行硬编码时，switch块会按预期工作。查看ReadString（）函数代码，它返回一个字符串，因此我看不到任何原因导致我的示例不起作用。难道我做错了什么？！问题答案：您的文本包含两个字节：是2和是1。您第二个符号是不可见的，您可以尝试使用将其删除。

这个Java for HDInsight Hadoop有什么问题吗？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档