在实际的训练中,训练的结果对训练集的拟合程度通常还是挺好,但是对训练集之外的数据的拟合程度通常就不那么令人满意。
因此我们通常并不会把所有的数据集都拿来训练,而是分出一部分来(这一部分不参加训练)对训练集生成的参数进行测试,相对客观的判断这些参数对训练集之外的数据的符合程度,适用解决遇到的过拟合或欠拟合情况。
将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集(validation set or test set)。
首先用训练集对分类器进行训练,再利用验证集来测试训练得到的模型(model),以此来做为评价分类器的性能指标。
1、简单交叉验证
2、2-折交叉验证(2-fold Cross Validation,记为2-CV)
3、K-折交叉验证(K-fold Cross Validation,记为K-CV)
eg:
十折交叉验证
留一交叉验证(Leave-One-Out Cross Validation记为LOO-CV)
https://blog.csdn.net/weixin_40475450/article/details/80578943