当前位置: 首页 > 工具软件 > Hibench > 使用案例 >

Hibench安装、使用文档

督坚白
2023-12-01

已经编译好的软件包,有snappy算法和无snappy算法的两个包 ,版本号: 7.0

https://pan.baidu.com/s/1QGms8zj1GYUYmH1YSK7R3w 
提取码:3hb2 

不想下载编译好的软件包的小伙伴,可以到  https://download.csdn.net/download/registerluo/10834271 下载dfsioe支持hadoop集成snappy的修改好的原码包。

Hibench简介

Hibench是一个大数据 benchmark 套件,用来测试各种大数据框架的速度,吞吐量,系统资源利用率。它支持的框架有:hadoopbench、sparkbench、stormbench、flinkbench、gearpumpbench。

 

一、安装环境:安装在 hadoop 集群的一台linux服务器即可。 hibench的版本7.0 。

1 修改HiBench-master/conf/hadoop.conf配置项

hibench.hadoop.home /usr/local/hadoop #hadoop的home路径

hibench.hdfs.master hdfs://mycluster:8020 #单机或集群的 hdfs uri

hibench.hadoop.release apache # 支持hadoop的版本有 apache, cdh5, hdp

2 修改HiBench-master/conf/hibench.conf

hibench.scale.profile tiny # 数据量有 tiny, small, large, huge, gigantic and bigdata

hibench.home /home/hadoop/HiBench-master # hibench.home路径

3 修改 HiBench-master/conf/frameworks.lst

根据需要选择一个或全选 ,前面加 # 代表不选择

hadoop

#spark

4 HiBench-master/conf/benchmarks.lst 测试的用例场景 ,

5 修改 HiBench-master/bin/workloads/micro/dfsioe/prepare/prepare.sh

在 run_hadoop_job 行的上一行添加下面配置

INPUT_HDFS=hdfs://mycluster/HiBench/Dfsioe/Input # hdfs的路径,不带端口

6 修改HiBench-master/bin/workloads/micro/dfsioe/hadoop/run_read.sh

在 SIZE=`dir_size $INPUT_HDFS` 行的上一行添加下面配置

INPUT_HDFS=hdfs://mycluster/HiBench/Dfsioe/Input # hdfs的路径,不带端口

7 修改HiBench-master/bin/workloads/micro/dfsioe/hadoop/run_write.sh

在 # pre-running 行的上一行添加下面配置

OUTPUT_HDFS=hdfs://mycluster/HiBench/Dfsioe/Onput # hdfs的路径,不带端口

INPUT_HDFS=hdfs://mycluster/HiBench/Dfsioe/Input # hdfs的路径,不带端口

二、测试

1 全部场景测试:

在 HiBench-master/bin目录下执行 , 注意 “.”

./run_all.sh

2 单个测试 ,测试的场景都在 HiBench-master/bin/workloads 目录下

举测试 hadoo 的 WordCount场景为例,其它场景类似。

a 在 HiBench-master/bin/workloads/micro/wordcount/prepare 目录下执行

./prepare.sh

b 在 HiBench-master/bin/workloads/micro/wordcount/hadoop 目录下执行

./run.sh

三、取测试报告

把 HiBench-master/report/hibench.report 文件下载到本地

四、注意事项

1 dfsioe 测试场景不支持 hadoop 集成了snappy算法。

2 所有运行的测试场景的日志都在 HiBench-master/report 中

 类似资料: