环境设置(Environment Setup)
在本章中,您将学习如何在本地计算机上设置Python机器学习的工作环境。
库和包
要了解机器学习,您需要具备Python编程的基本知识。 此外,还有许多库和包通常用于执行下面列出的各种机器学习任务 -
numpy - 用于其N维数组对象
pandas - 是一个包含数据帧的数据分析库
matplotlib - 用于创建图形和图形的2D绘图库
scikit-learn - 用于数据分析和数据挖掘任务的算法
seaborn - 基于matplotlib的数据可视化库
安装 (Installation)
您可以使用此处讨论的两种方法中的任何一种安装机器学习软件 -
Method 1
在各种操作系统上从python.org单独下载并安装Python,如下所述 -
要在下载后安装Python,请双击.exe (对于Windows)或.pkg (对于Mac)文件,然后按照屏幕上的说明进行操作。
对于Linux OS,请在提示符处使用以下命令检查是否已安装Python -
$ python --version. ...
如果未安装Python 2.7或更高版本,请使用发行版的软件包管理器安装Python。 请注意,命令和包名称会有所不同。
关于Debian衍生品,如Ubuntu,你可以使用apt -
$ sudo apt-get install python3
现在,打开命令提示符并运行以下命令以验证Python是否已正确安装 -
$ python3 --version
Python 3.6.2
同样,我们可以使用像pip这样的安装程序单独下载和安装必要的库,如numpy,matplotlib等。 为此,您可以使用此处显示的命令 -
$pip install numpy
$pip install matplotlib
$pip install pandas
$pip install seaborn
Method 2
或者,要同时安装Python和其他科学计算和机器学习包,我们应该安装Anaconda发行版。 它是Linux,Windows和OSX的Python实现,包含各种机器学习包,如numpy,scikit-learn和matplotlib。 它还包括Jupyter Notebook ,一个交互式Python环境。 我们可以根据我们的要求安装Python 2.7或任何3.x版本。
要从Continuum Analytics下载免费的Anaconda Python发行版,您可以执行以下操作 -
访问Continuum Analytics的官方网站及其下载页面。 请注意,安装过程可能需要15-20分钟,因为安装程序包含Python,关联软件包,代码编辑器和其他一些文件。 根据您的操作系统,选择安装过程,如下所述 -
For Windows - 选择Anaconda for Windows部分,并使用Python 2.7或3.x查看列。 您可以发现安装程序有两个版本,一个用于32位Windows,另一个用于64位Windows。 选择相关的一个。
For Mac OS - 滚动到Anaconda for OS X section 。 使用Python 2.7或3.x查看该列。 请注意,此处只有一个版本的安装程序:64位版本。
For Linux OS - 我们选择“Anaconda for Linux”部分。 使用Python 2.7或3.x查看该列。
请注意,您必须确保Anaconda的Python发行版安装在单个目录中,并且不会影响系统上的其他Python安装(如果有)。
要使用图形和图表,我们需要这些Python库包 - matplotlib和seaborn 。
如果你使用的是Anaconda Python,你的系统已经安装了numpy,matplotlib,pandas,seaborn等。 我们启动Anaconda Navigator来访问Jupyter Note书或Python的Spyder IDE。
打开其中任何一个后,键入以下命令 -
import numpy
import matplotlib
现在,我们需要检查安装是否成功。 为此,请转到命令行并键入以下命令 -
$ python
Python 3.6.3 |Anaconda custom (32-bit)| (default, Oct 13 2017, 14:21:34)
[GCC 7.2.0] on linux
接下来,您可以导入所需的库并打印其版本,如下所示 -
>>>import numpy
>>>print numpy.__version__
1.14.2
>>> import matplotlib
>>> print (matplotlib.__version__)
2.1.2
>> import pandas
>>> print (pandas.__version__)
0.22.0
>>> import seaborn
>>> print (seaborn.__version__)
0.8.1