Python Data Science Environment Setup
要在本教程中成功创建和运行示例代码,我们需要一个环境设置,它既包含通用python,也包含Data Science所需的特殊包。 我们首先看一下安装python 2或python 3的通用python。但我们更喜欢本教程的python 2,主要是因为它的成熟度和对外部包的更广泛的支持。
获取Python
最新和最新的源代码,二进制文件,文档,新闻等,可在Python官方网站https://www.python.org/
您可以从https://www.python.org/doc/下载Python文档。 该文档以HTML,PDF和PostScript格式提供。
安装Python (Installing Python)
Python发行版适用于各种平台。 您只需下载适用于您的平台的二进制代码并安装Python。
如果您的平台的二进制代码不可用,则需要C编译器手动编译源代码。 编译源代码在选择安装所需的功能方面提供了更大的灵活性。
以下是在各种平台上安装Python的快速概述 -
Unix和Linux安装
以下是在Unix/Linux机器上安装Python的简单步骤。
打开Web浏览器并转到https://www.python.org/downloads/ 。
点击链接下载适用于Unix/Linux的压缩源代码。
下载并解压缩文件。
如果要自定义某些选项,请编辑Modules/Setup文件。
运行./configure脚本
make
make install
这将在标准位置/usr/local/bin及其库中安装Python,位于/usr/local/lib/pythonXX ,其中XX是Python的版本。
Windows安装 (Windows Installation)
以下是在Windows机器上安装Python的步骤。
打开Web浏览器并转到https://www.python.org/downloads/ 。
按照Windows安装程序python-XYZ.msi文件的链接进行操作,其中XYZ是您需要安装的版本。
要使用此安装程序python-XYZ.msi ,Windows系统必须支持Microsoft Installer 2.0。 将安装程序文件保存到本地计算机,然后运行它以查明您的计算机是否支持MSI。
运行下载的文件。 这将打开Python安装向导,它非常易于使用。 只需接受默认设置,等到安装完成,然后就完成了。
Macintosh安装
最近的Mac安装了Python,但它可能已经过时了几年。 有关获取当前版本以及支持Mac上开发的其他工具的说明,请http://www.python.org/download/mac/ 。 对于Mac OS X 10.3(2003年发布)之前的旧Mac OS,可以使用MacPython。
Jack Jansen维护它,您可以在他的网站http://www.cwi.nl/~jack/macpython.html完全访问整个文档。 您可以找到Mac OS安装的完整安装详细信息。
设置PATH (Setting up PATH)
程序和其他可执行文件可以位于许多目录中,因此操作系统提供了一个搜索路径,列出了OS搜索可执行文件的目录。
该路径存储在环境变量中,该变量是由操作系统维护的命名字符串。 此变量包含命令shell和其他程序可用的信息。
path变量在Unix中命名为PATH,在Windows中命名为Path(Unix区分大小写; Windows不是)。
在Mac OS中,安装程序会处理路径详细信息。 要从任何特定目录调用Python解释器,必须将Python目录添加到路径中。
在Unix/Linux上设置路径
要将Python目录添加到Unix中特定会话的路径 -
In the csh shell - 键入setenv PATH“$ PATH:/ usr/local/bin/python”并按Enter键。
In the bash shell (Linux) - 键入export ATH =“$ PATH:/ usr/local/bin/python”并按Enter键。
In the sh or ksh shell - 键入PATH =“$ PATH:/ usr/local/bin/python”并按Enter键。
Note - /usr/local/bin/python是Python目录的路径
在Windows上设置路径
要将Python目录添加到Windows中特定会话的路径中 -
At the command prompt - 键入path%path%; C:\Python并按Enter键。
Note - C:\Python是Python目录的路径
Python Environment Variables
以下是重要的环境变量,可以被Python识别 -
Sr.No. | 变量和描述 |
---|---|
1 | PYTHONPATH 它的作用类似于PATH。 此变量告诉Python解释器在何处找到导入程序的模块文件。 它应该包括Python源库目录和包含Python源代码的目录。 PYTHONPATH有时由Python安装程序预设。 |
2 | PYTHONSTARTUP 它包含包含Python源代码的初始化文件的路径。 每次启动解释器时都会执行它。 它在Unix中命名为.pythonrc.py,它包含加载实用程序或修改PYTHONPATH的命令。 |
3 | PYTHONCASEOK 它在Windows中用于指示Python在import语句中找到第一个不区分大小写的匹配项。 将此变量设置为任何值以激活它。 |
4 | PYTHONHOME 它是另一种模块搜索路径。 它通常嵌入在PYTHONSTARTUP或PYTHONPATH目录中,以便于切换模块库。 |
运行Python (Running Python)
启动Python有三种不同的方法 -
交互式解释器 (Interactive Interpreter)
您可以从Unix,DOS或任何其他为您提供命令行解释器或shell窗口的系统启动Python。
输入python命令行。
立即在交互式解释器中开始编码。
$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS
以下是所有可用命令行选项的列表 -
Sr.No. | 选项和说明 |
---|---|
1 | -d 它提供调试输出。 |
2 | -O 它生成优化的字节码(产生.pyo文件)。 |
3 | -S 不要运行导入站点以在启动时查找Python路径。 |
4 | -v 详细输出(导入语句的详细跟踪)。 |
5 | -X 禁用基于类的内置异常(只使用字符串); 从版本1.6开始过时。 |
6 | -c cmd 运行以cmd字符串形式发送的Python脚本 |
7 | file 从给定文件运行Python脚本 |
命令行脚本 (Script from the Command-line)
可以通过在应用程序上调用解释器在命令行执行Python脚本,如下所示 -
$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or
C: >python script.py # Windows/DOS
Note - 确保文件权限模式允许执行。
集成开发环境 (Integrated Development Environment)
如果您的系统上有支持Python的GUI应用程序,您也可以从图形用户界面(GUI)环境运行Python。
Unix - IDLE是第一个用于Python的Unix IDE。
Windows - PythonWin是第一个用于Python的Windows界面,是一个带有GUI的IDE。
Macintosh - 可以从主网站获得Macintosh版本的Python以及IDLE IDE,可以下载为MacBinary或BinHex'd文件。
安装SciPy Pack
启用所需包的最佳方法是使用特定于您的操作系统的可安装二进制包。 这些二进制文件包含完整的SciPy堆栈(包括NumPy,SciPy,matplotlib,IPython,SymPy和nose包以及核心Python)。
Windows
Anaconda(来自www.continuum.io )是SciPy堆栈的免费Python发行版。 它也适用于Linux和Mac。
Canopy( www.enthought.com/products/canopy/ )提供免费和商业发布,包括适用于Windows,Linux和Mac的完整SciPy堆栈。
Python(x,y):它是一个免费的Python发行版,包含SciPy堆栈和适用于Windows操作系统的Spyder IDE。 (可从www.python-xy.github.io/下载)
Linux
各个Linux发行版的软件包管理器用于在SciPy堆栈中安装一个或多个软件包。
对于Ubuntu
sudo apt-get install python-numpy
python-scipy python-matplotlibipythonipythonnotebook python-pandas
python-sympy python-nose
对于Fedora
sudo yum install numpyscipy python-matplotlibipython
python-pandas sympy python-nose atlas-devel
从Source构建
必须使用distutils安装Core Python(2.6.x,2.7.x和3.2.x及更高版本),并且应启用zlib模块。
GNU gcc(4.2及以上版本)C编译器必须可用。
要安装NumPy,请运行以下命令。
Python setup.py install
让我们测试NumPy模块是否正确安装,尝试从Python提示符导入它。
如果未安装,将显示以下错误消息。
Traceback (most recent call last):
File "<pyshell#0>", line 1, in <module>
import numpy
ImportError: No module named 'numpy'
同样,我们可以检查下一章中显示的所有必需的Data Science包的安装。