python执行py文件的流程
当我们执行一个py文件的时候,直接python xx.py即可,那么这个流程是怎么样的呢。先说明一下,python执行代码实际上是先打开文件然后执行里面的代码,所以文件的扩展名不一定是py的形式,txt形式也是依旧可以成功执行,只要文件里面的代码是符合python规范的。下面我们来看看python是怎么执行py文件的。
先将文件里面的内容读取出来,scanner对其进行扫描,切分成一个个的token
parser对token进行解析,建立抽象语法树(AST,abstract syntax tree)
compiler对ast进行编译,得到python字节码
code evaluator执行字节码
我们注意到第三个过程,是一个编译的过程。说明python即便是解释性语言,也依旧存在着编译的过程,这一点和java是一样的。之所以要存在编译的过程,主要是为了优化执行的速度,比如元组,或者函数里面出现了yield,这一点在编译的时候就已经确定了,编译的时候就已经知道这是一个什么样的数据结构,那么在执行的时候可以很快速的分配相应的内存。我们在打开python文件所在的目录的时候,总会看到一个__pycache__的文件夹,这里面存放的就是python编译之后的字节码。当执行python文件的时候,会检测当前的__pycache__目录中是否有对应的字节码,没有就创建,有的话比较字节码的创建时间和当前py文件的修改时间,如果字节码的创建时间要晚一些,说明用户没有修改文件,于是执行字节码,如果字节码的创建时间要早一些,说明用户修改了python源代码,那么就会从新编译得到一个新的字节码。此外编译还有一个重要的特点,就是语法检测。错误分为两种:一种是语法错误,另一种是逻辑错误。语法错误就是源代码没有遵循python的规范,比如if判断使用了一个=,或者for循环后面没有:等等,这些都是属于语法错误,这是一种低级的错误,在编译的时候就会失败。try:
>
except Exception:
pass
"""
这个代码是编译不过去的,即便你使用了try···except。
语法错误就是不遵循python规范,编译的时候都编译不过。
"""
那么另一种错误就是逻辑错误,这是语法没问题,但是执行的时候出错了,比如索引越界、和0相除、变量没有定义等等,这些错误是在运行的时候才会出现的,这是可以被捕获的。try:
a
except Exception:
pass
# 这段代码是不会报错的。
python如何编译py文件生成字节码
python中的字节码有两种,pyc和pyo,两者本质上没啥区别,只不过pyo的优化程度更高一些。
编译可以通过py_compile模块进行编译# test.py
def foo(name):
print("hello " + name)
我们来对test.py进行编译import py_compile
"""
参数如下:
file:要编译的py文件
cfile:编译之后的字节码文件,不指定的话默认为源文件目录下的__pycache__目录的下的'源文件名.解释器类型-python版本.字节码类型'文件
dfile:错误消息文件,默认和cfile一样,一般不用管
doraise:是否开启异常处理,默认和False
optimize:优化字节码级别。如果是pyc:可以选-1或0。pyo的话,可以选1或2。都是值越小优化程度越高
"""
py_compile.compile(file="test.py", cfile=r"./test.pyc", optimize=-1)
py_compile.compile(file="test.py", cfile=r"./test.pyo", optimize=1)
可以看到,已经编译成功了,pyc是可以直接当做普通py文件导入的,但是pyo貌似不可以,所以一般我们只编译成pyc形式的字节码。但是如果不导入只是执行的话,那么是可以编译成pyo的。import test
test.foo("mashiro") # hello mashiro
编译的另一种方式,我们也可以直接使用命令行。编译成pyc
python -m py_compile 源代码
编译成pyo
python -O -m py_compile 源代码
如果需要编译整个目录内的所有源代码
python compileall
python编译py文件生成.pyd(.so)
为什么会有pyd,因为更安全,如果不希望源代码被公开的话,可以变成扩展模块。字节码是可以被反编译的,但是pyd目前还没有被反编译的情况,而且在编译成pyd之后会更快。首先要安装Cython,直接pip install 即可
pyd相当于是Windows中的dll,不同的是pyd只能被python调用。# test.py
def add(a: int, b: int) -> int:
return a + b
def haha(n: int) -> int:
return sum(range(n))
下面编译test.py生成pyd# to_pyd.py
import Cython.Build
# 这个函数将会在对应py文件的目录下创建一个同名的.c文件,当然这个不重要
# 这个函数是有返回值的,会返回一个distutils.extension.Extension对象列表
ext = Cython.Build.cythonize("test.py")
# 下面还要导入另一个模块
import distutils.core
# 调用setup方法
distutils.core.setup(
name="mashiro.pyd", # 编译后的pyd文件名
version="1.0", # 报的版本号,这个无所谓,可以不用管
ext_modules=ext, # 这个很重要,就是我们使用Cython.Build.cythonize返回的结果
author="猪哥哥", # 无所谓,可以不管
author_email="shiinamashiro163@gmail.com" # 邮箱,可以不用管
)
然后最后一步,打开所在终端,执行编译python to_pyd.py build
或者
python to_pyd.py build_ext
编译之后会得到一个build目录,里面就是编译之后的内容
在Windows上会得到pyd,但是在linux上会得到.so文件
这个文件和Windows的pyd一样,是可以当做普通模块直接导入的。# 1.py
import test # 直接导入即可,后面那一大串不用管
print(test) #
print(test.__file__) # /home/wmz/build/lib.linux-x86_64-3.7/test.cpython-37m-x86_64-linux-gnu.so
print(test.add(100, 200)) # 300
print(test.haha(1000000)) # 499999500000
python中嵌入C语言
1.c#include
#include
int add(int a, int b)
{
return a + b;
}
int sub(int a, int b)
{
return a - b;
}
编译这段c代码,生成.so文件,此时的.so文件不是由python代码生成的,而是由c代码生成,所以就不能通过import的方式直接导入了
编译:gcc -o 编译之后的dll或者so文件名 -shared c源文件import ctypes
lib = ctypes.cdll.LoadLibrary("./heiheihei.so") # 加载共享库
# 直接调用相应的函数即可
print(lib.add(20, 10))
print(lib.sub(20, 10))
当然c中各种类型,在ctypes都有对应。比如结构体、指针等等,更复杂的用法可以参考官网。