当前位置: 首页 > 工具软件 > OpenBLAS > 使用案例 >

openblas编译自定义变量

林曦之
2023-12-01

OpenBLAS是高性能多核BLAS库,是GotoBLAS2 1.13 BSD版本的衍生版。项目主页是 https://github.com/xianyi/OpenBLAS 。

通常的编译安装流程如下:

make CC=gcc-4.7 FC=gfortran (通常情况下,make会进行自动探测,够用了)
make PREFIX=/your/path install (可选)
1
2
其中,make过程会自动的探测当前机器和编译环境,设置合适的选项。需注意的是,OpenBLAS会下载netlib上的LAPACK源代码。也就是说你的机器必须联网,或者放入lapack的源代码包,或者不包括LAPACK即make NO_LAPACK=1。

如果自动探测不够用,可以考虑下面几个常用选项,具体请参考Makefile.rule文件:

编译32位或者64位, make BINARY=32 或者 make BINARY=64 (如果不设置,会自动探测)
设置目标CPU,比如目标CPU为sandybridge或者nehalem,make TARGET=SANDYBRIDGE 或者 make TARGET=NEHALEM (如果不设置,会自动探测)

在x86/x86_64架构上,程序库包含多个CPU的汇编优化代码,make DYNAMIC_ARCH=1

不包含CBLAS接口,make NO_CBLAS=1
不包含LAPACK, make NO_LAPACK=1
包含LAPACK,但是不包含LAPACKE接口,make NO_LAPACKE=1
编译单线程库, make USE_THREAD=0 (如果不设置为0,会自动探测是否多核处理器,默认使用pthread并行)
编译OpenMP多线程库,make USE_OPENMP=1
设置最大线程数量为n,make NUM_THREADS=n
禁用CPU亲和性,make NO_AFFINITY=1
当在低版本的系统上编译失败时,可以按照https://github.com/xianyi/OpenBLAS/blob/develop/TargetList.txt里的cpu型号进行编译

 类似资料: