机器学习:使用Python

优质
小牛编辑
141浏览
2023-12-01

Scikit-learn (http://scikit-learn.org/) 是一个机器学习领域的开源套件。整个专案起始于 2007年由David Cournapeau所执行的Google Summer of Code 计画。而2010年之后,则由法国国家资讯暨自动化研究院(INRIA, http://www.inria.fr) 继续主导及后续的支持及开发。近几年(2013-2015)则由 INRIA 支持 Olivier Grisel (http://ogrisel.com) 全职负责该套件的维护工作。以开发者的角度来观察,会发现Scikit-learn的整套使用逻辑设计的极其简单。往往能将繁杂的机器学习理论简化到一个步骤完成。Python的机器学习相关套件相当多,为何Scikit-learn会是首选之一呢?其实一个开源套件的选择,最简易的指标就是其contributor: 贡献者commits:版本数量 以及最新的更新日期。下图是2016/1/3 经过了美好的跨年夜后,笔者于官方开源程式码网站(https://github.com/scikit-learn/scikit-learn) 所撷取的画面。我们可以发现最新commit是四小时前,且contributorcommit数量分别为531人及 20,331个。由此可知,至少在2016年,这个专案乃然非常积极的在运作。在众多机器学习套件中,不论是贡献者及版本数量皆是最庞大的。也因此是本文件介绍机器学习的切入点。未来,我们希望能介绍更多的机器学习套件以及理论,也欢迎有志之士共同参与维护。

机器学习:使用Python - 图3