ycsb是一个非常方便的针对分布式文件系统的测试工具:[url]https://github.com/brianfrankcooper/YCSB[/url]
特点:
1 可以任意设置读写比例、线程数量,打印结果比较详细
2 它是hbase等nosql官方jira上面的测试标准,与人交流时ycsb的测试数据最能说明问题
缺点:
1 每次测试时数据需要重新写入,否则读取时选取不了正确的key值,导致内存命中率低
2 key值分布不均匀,节点多数据少时,会导致倾斜
3 线程多时有bug
这里讲一下针对hbase的使用体验:
1 git clone下来源文件后,需要先编译。ant及ant相应的数据库,如ant dbcompile-hbase
2 拷贝hbase/hadoop/zookeepeer的jar包及运行时需要的logging等jar包到db/hbase/lib/
3 拷贝hbase-site.xml到hbase/conf/
4 测试只需执行以下命令即可:
java -cp build/ycsb.jar:db/hbase/lib/* com.yahoo.ycsb.Client -p columnfamily=f1 -db com.yahoo.ycsb.db.HBaseClient -P workloads/zhu -threads 50 -load
注:workloads/zhu为测试的配置文件,详细说明见[url]https://github.com/brianfrankcooper/YCSB/wiki/Core-Properties[/url]
关于这些配置,最好还是看一下源代码,理解会更深入一些,特别是requestdistribution和insertorder选项