提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
一、Benchmark是什么
Benchmark(基准测试)是一个评价方式,主要应用于计算机的性能测试,主要展现在执行时间、速度、吞吐量等。
二、Benchmark的构成
1、数据集
1)结构化数据:经典的数据模型,可用表来描述。如excel,数据库等。
2)半结构化数据:如XML、HTML等,有如邮件系统、资源库等。
3)非结构化数据:各种图片、视频和音频等,有如相册,视频网站。
2、工作负载
1)密集计算类型:CPU密集型计算、网络密集型计算;
2)计算范式:批处理图计算、机器学习;
3)计算延迟:在线计算、离线计算、实时计算;
3、度量指标
1)工具
a)在架构层面:pref、nmon
b)在jvm层面:btrace、Jconsole、JVisualVM、JMap、JStack
c)在Spark层面:web ui、console log
2)度量指标
a)从架构角度度量:浮点型操作密度、整数型操作密度等
b)从Spark系统资源利用率的角度度量:CPU在指定时间段的利用率、内存在指定时间段的利用率、磁盘在指定时间段的利用率、网络带宽在指定时间段的利用率等
c)从系统吞吐量:文件执行时间、吞吐量
三、我目前所学(以上为粗略理解,部分参考csdn博主行者小猪)
1.本周我主要在看神经网络方面的内容,配置了一个git,简单尝试配了一下训练人工智能的环境(可惜失败了)