https://pan.baidu.com/s/1QGms8zj1GYUYmH1YSK7R3w
提取码:3hb2
不想下载编译好的软件包的小伙伴,可以到 https://download.csdn.net/download/registerluo/10834271 下载dfsioe支持hadoop集成snappy的修改好的原码包。
Hibench是一个大数据 benchmark 套件,用来测试各种大数据框架的速度,吞吐量,系统资源利用率。它支持的框架有:hadoopbench、sparkbench、stormbench、flinkbench、gearpumpbench。
hibench.hadoop.home /usr/local/hadoop #hadoop的home路径
hibench.hdfs.master hdfs://mycluster:8020 #单机或集群的 hdfs uri
hibench.hadoop.release apache # 支持hadoop的版本有 apache, cdh5, hdp
hibench.scale.profile tiny # 数据量有 tiny, small, large, huge, gigantic and bigdata
hibench.home /home/hadoop/HiBench-master # hibench.home路径
根据需要选择一个或全选 ,前面加 # 代表不选择
hadoop
#spark
在 run_hadoop_job 行的上一行添加下面配置
INPUT_HDFS=hdfs://mycluster/HiBench/Dfsioe/Input # hdfs的路径,不带端口
在 SIZE=`dir_size $INPUT_HDFS` 行的上一行添加下面配置
INPUT_HDFS=hdfs://mycluster/HiBench/Dfsioe/Input # hdfs的路径,不带端口
在 # pre-running 行的上一行添加下面配置
OUTPUT_HDFS=hdfs://mycluster/HiBench/Dfsioe/Onput # hdfs的路径,不带端口
INPUT_HDFS=hdfs://mycluster/HiBench/Dfsioe/Input # hdfs的路径,不带端口
在 HiBench-master/bin目录下执行 , 注意 “.”
./run_all.sh
举测试 hadoo 的 WordCount场景为例,其它场景类似。
a 在 HiBench-master/bin/workloads/micro/wordcount/prepare 目录下执行
./prepare.sh
b 在 HiBench-master/bin/workloads/micro/wordcount/hadoop 目录下执行
./run.sh
把 HiBench-master/report/hibench.report 文件下载到本地