本章小结
优质
小牛编辑
122浏览
2023-12-01
在本章中,我们介绍了集成学习领域中最热门且应用最广泛的技术。集成方法通过组合不同的分类器模型来抵消各分类器固有的缺陷,通常能够得到一个稳定且性能优异的模型,因此在业界和机器学习竞赛领域得到了广泛的追捧。
在本章的开始,我们用Python实现了一个MajorityVoteClassifier类,它可以通过组合不同的算法得到一个分类器。进而我们学习了bagging,它能够在训练集上通过bootstrap进行随机抽样,并以多数投票为准则组合多个单独训练的成员分类器,成为一种能够有效降低模型方差的模型。然后我们讨论了AdaBoost,它是一种基于弱学习机的算法,能够从前一个弱学习机错误中进行学习。
在前面的章节中,我们讨论了各种学习算法、调优和评估技术。后面的章节,我们将着眼于机器学习的一个特定应用——情感分析,这已成为互联网和社交媒体时代一个有趣的话题。