本章小结
优质
小牛编辑
120浏览
2023-12-01
本章中,读者学习了三种不同的聚类算法,它们可以帮助我们发现隐藏在数据背后的结构或者信息。本章开始就介绍了基于原型的k-means算法,此算法可以基于指定数量的簇中心,将样本划分为球形的簇。由于聚类是一种无监督方法,我们无法奢求根据真实的类标来衡量模型的性能。因此,我们使用数据内在有用的性能指标(如肘方法,或者轮廓分析)来尝试对聚类的质量进行量化评定。
接下来,我们学习了另外一种聚类方法:凝聚层次聚类。层次聚类不需要事先指定簇的数量,而且聚类的结果可以通过树状图进行可视化展示,这有助于分析和解释聚类结果。本章介绍的最后一个算法是DBSCAB,此算法基于样本的密度对其进行分组,并且它可以处理异常值以及识别非球型簇。
在学习完无监督学习知识后,是时候介绍一些监督学习领域最令人兴奋的机器学习算法了:多层人工神经网络。随着近年来的复兴,神经网络又一次成为机器学习研究领域的热门话题。借助于新近推出的深度学习算法,神经网络被视为适用于图像分类和语音识别等多种复杂任务的最先进方法。在第12章,我们将从零开始构建多层神经网络。在第13章,我们将介绍一种功能强大的第三方库,它能够帮助我们高效地训练复杂的神经网络。