本章小结
希望读者能够喜欢这令人兴奋的机器学习之旅的最后一章。纵观全书,基本涵盖了机器学习领域中全部的内容,而读者也应该有能力将这些技术应用到解决现实世界中的问题。
我们通过对几种不同类型机器学习任务的概述开启了机器学习之旅:监督学习、强化学习,以及无监督学习。我们讨论了用于分类的几种不同的学习算法,并在第2章中介绍了简单的单层神经网络。然后,我们在第3章中讨论了更加高级的分类算法,在第4和第5章中,我们学习了机器学习中至关重要的环节:数据预处理及数据压缩。请大家牢记:即使是最先进的算法也要受制于训练数据所蕴含的信息。在第6章中,我们学习了关于预测模型构建与评估的最佳实践,这也是机器学习应用中的另一重要环节。如果单个学习算法的性能无法达到我们的预期,通过集成多个算法进行预测也许会有所帮助,我们在第7章中对此进行了讨论。在现代社会中,来自互联网中社交媒体平台的文本文档可能是最有趣的数据形式了,我们在第8章中使用机器学习对此类数据进行了分析。不过,机器学习技术并不仅仅只能应用于离线数据分析,在第9章中,我们学习了如何将机器学习模型嵌入到Web应用中使之能够得到更为广泛的应用。大多数情况下,我们的重点是分类算法,这也许是机器学习领域最为流行的应用。不过,不止如此,我们在第10章中介绍了几种用于预测连续输出值的回归算法。机器学习中另一个令人兴奋的领域就是聚类分析,它可以帮助我们在训练数据没有正确引导结果的情况下发现数据中蕴含的结构,我们在第11章中对此做了介绍。
在本书的最后两个章节中,我们学习了整个机器学习领域最美丽也最令人激动的算法:人工神经网络。虽然深度学习已经超出了本书的范围,但我们希望至少能激起读者对当前这一发展迅速的领域的兴趣。如果读者考虑以机器学习研究作为自己的事业,或者仅仅是追赶这一领域的最新进展,建议阅读此领域顶级专家的著作,例如:Geoff Hinton(http://www.cs.toronto.edu/~hinton/),Andrew Ng(http://www.andrewng.org),Yann LeCun(http://yann.lecun.com),Juergen Schmidhuber(http://people.idsia.ch/~juergen/),以及Yoshua Bengio(http://www.iro.umontreal.ca/~bengioy)等。同时,还请加入scikit-learn、Theano以及Keras的邮件列表以参与到关于这些库及机器学习的有趣讨论中。期待在那里与读者相遇!如果对本书有任何疑问或者需要某些建议与提示,也欢迎读者与作者联系!
希望这本包含了机器学习各方面内容介绍的著作能够让读者觉得学有所值,也希望读者能够真正掌握许多新且有用的技巧来推动职业生涯的发展,同时将这些知识运用到现实世界中去解决实际问题。