当前位置: 首页 > 工具软件 > eg-validation > 使用案例 >

交叉验证(Cross Validation)

齐振
2023-12-01

用处:

      在实际的训练中,训练的结果对训练集的拟合程度通常还是挺好,但是对训练集之外的数据的拟合程度通常就不那么令人满意

      因此我们通常并不会把所有的数据集都拿来训练,而是分出一部分来(这一部分不参加训练)对训练集生成的参数进行测试,相对客观的判断这些参数对训练集之外的数据的符合程度,适用解决遇到的过拟合或欠拟合情况。

 

基本思想:

      将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集(validation set or test set)

      首先用训练集对分类器进行训练,再利用验证集来测试训练得到的模型(model),以此来做为评价分类器的性能指标。

 

常见用法:

      1、简单交叉验证

      2、2-折交叉验证(2-fold Cross Validation,记为2-CV)

      3、K-折交叉验证(K-fold Cross Validation,记为K-CV)

   eg:

      十折交叉验证

      留一交叉验证(Leave-One-Out Cross Validation记为LOO-CV)

      https://blog.csdn.net/weixin_40475450/article/details/80578943

 

具体原理:

      https://zhuanlan.zhihu.com/p/24825503?refer=rdatamining

 类似资料: