OpenBLAS是高性能多核BLAS库,是GotoBLAS2 1.13 BSD版本的衍生版。项目主页是 https://github.com/xianyi/OpenBLAS 。
通常的编译安装流程如下:
make CC=gcc-4.7 FC=gfortran (通常情况下,make会进行自动探测,够用了)
make PREFIX=/your/path install (可选)
1
2
其中,make过程会自动的探测当前机器和编译环境,设置合适的选项。需注意的是,OpenBLAS会下载netlib上的LAPACK源代码。也就是说你的机器必须联网,或者放入lapack的源代码包,或者不包括LAPACK即make NO_LAPACK=1。
如果自动探测不够用,可以考虑下面几个常用选项,具体请参考Makefile.rule文件:
编译32位或者64位, make BINARY=32 或者 make BINARY=64 (如果不设置,会自动探测)
设置目标CPU,比如目标CPU为sandybridge或者nehalem,make TARGET=SANDYBRIDGE 或者 make TARGET=NEHALEM (如果不设置,会自动探测)
在x86/x86_64架构上,程序库包含多个CPU的汇编优化代码,make DYNAMIC_ARCH=1
不包含CBLAS接口,make NO_CBLAS=1
不包含LAPACK, make NO_LAPACK=1
包含LAPACK,但是不包含LAPACKE接口,make NO_LAPACKE=1
编译单线程库, make USE_THREAD=0 (如果不设置为0,会自动探测是否多核处理器,默认使用pthread并行)
编译OpenMP多线程库,make USE_OPENMP=1
设置最大线程数量为n,make NUM_THREADS=n
禁用CPU亲和性,make NO_AFFINITY=1
当在低版本的系统上编译失败时,可以按照https://github.com/xianyi/OpenBLAS/blob/develop/TargetList.txt里的cpu型号进行编译