Benchmark初印象

谷弘致

2023-12-01

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

一、Benchmark是什么

Benchmark（基准测试）是一个评价方式，主要应用于计算机的性能测试，主要展现在执行时间、速度、吞吐量等。

二、Benchmark的构成

1、数据集

1）结构化数据：经典的数据模型，可用表来描述。如excel，数据库等。

2）半结构化数据：如XML、HTML等，有如邮件系统、资源库等。

3）非结构化数据：各种图片、视频和音频等，有如相册，视频网站。

2、工作负载

1）密集计算类型：CPU密集型计算、网络密集型计算；

2）计算范式：批处理图计算、机器学习；

3）计算延迟：在线计算、离线计算、实时计算；

3、度量指标

1）工具

a）在架构层面：pref、nmon

b）在jvm层面：btrace、Jconsole、JVisualVM、JMap、JStack

c）在Spark层面：web ui、console log

2）度量指标

a）从架构角度度量：浮点型操作密度、整数型操作密度等

b）从Spark系统资源利用率的角度度量：CPU在指定时间段的利用率、内存在指定时间段的利用率、磁盘在指定时间段的利用率、网络带宽在指定时间段的利用率等

c）从系统吞吐量：文件执行时间、吞吐量

三、我目前所学（以上为粗略理解，部分参考csdn博主行者小猪）

1.本周我主要在看神经网络方面的内容，配置了一个git，简单尝试配了一下训练人工智能的环境（可惜失败了）