当前位置：首页 > 工具软件 > Lighthouse Batch Reporter > 使用案例 >

batch batch-size

范翰海

2023-12-01

什么是batch,batch-size
深度学习训练过程本身是就是求损失函数的最小值。这一过程一般通过梯度下降来实现。如果训练一个epoch，遍历所有训练集，计算一次loss，反向传播一次，梯度也下降一次。如果把训练集切割成一些小的训练集，，每次遍历完一个小的训练集，就计算一次loss，反向传播一次，梯度下降一次，那么一个epoch中就可以实现多次梯度下降，从而能够加快训练的收敛速度。这个小的训练集就是一个batch，每个batch的大小就是batch-size。
batch-size大小对训练过程有什么影响
极端的例子，如果batch-size是整个训练集，那么每个epoch需要遍历所有的数据，导致占用的显存大，且收敛的速度慢。如果batch-size为1，那么相邻两次迭代权重梯度可能差异大，会导致梯度振荡，不容易收敛。所以一般batch-size取中间数，通常为64的倍数或因子。

还有说batch-size太大，可能会使得相邻两次迭代的数据分布相似，梯度差异小，从而使loss陷入局部最小值。

batch-size

类似资料：

相关阅读

是否有等效于background-size的图像元素覆盖和包含？如何在Go中将[Size] byte转换为字符串？速记背景属性（CSS3）中的background-size Crop image to smallest size by removing transparent pixels in java 如何在具有background-size的div上缩放背景图像

相关文章

相关问答

rust中的类型“”没有实现“core:：gends:：Sized”的特性是什么？如何使font-size相对于父div？我想为SingularyLinkedList实现size（）方法 Spring Boot句柄SizeLimitExceededException protobuf message（c）类是否提供size（）和empty（）之类的方法？