#这是使用NVBLAS库的配置文件#设置环境变量NVBLAS_CONFIG_FILE以指定您自己的配置文件。#默认情况下,如果未定义NVBLAS_CONFIG_FILE,#NVBLAS Library将尝试打开其当前目录中的文件“NVBLAS.conf”#示例:NVBLAS_CONFIG_FILE/home/cuda_user/my_NVBLAS.conf#配置文件应该具有受限的写入权限访问#指定哪个输出日志文件(默认为stderr)NVBLAS_LOGFILE NVBLAS.log#启用每个拦截的BLAS调用的跟踪日志NVBLAS_TRACE_LOG_禁用#将您选择的CPU BLAS后备库放在这里#强烈建议使用完整路径来描述CPU库的位置NVBLAS_CPU_BLAS_LIB/usr/LIB/libopenblas.so#NVBLAS_CPU_BLAS_LIB<mkl_path_installation>/libmkl_rt.so#要参与计算的GPU设备Id列表#如果您希望所有的GPU都做出贡献,请使用ALL#如果希望所有与设备0类型相同的GPU都参与,请使用ALL0#然而,NVBLAS认为所有GPU都具有相同的性能和PCI带宽#默认情况下,如果未列出GPU,则仅使用设备0#NVBLAS_GPU_LIST 0 2 4#NVBLAS_GPU_LIST全部NVBLAS_GPU_LIST所有0#平铺尺寸NVBLAS_TILE_DIM 2048#自动锁定存储器NVBLAS_AUTOPIN_MEM启用#阻止在GPU上运行的BLAS例程列表(用于调试目的#NVBLAS支持的BLAS例程的当前列表为#GEMM、SYRK、HERK、TRSM、TRMM、SYMM、HEMM、SYR2 K、HER2 K#NVBLAS_GPU_DISABLED_SGEMM公司#NVBLAS_GPU_DISABLED_DGEMM公司#NVBLAS_GPU_DISABLED_CGEMM公司#NVBLAS_GPU_DISABLED_ZGEMM公司#可以选择在CPU和GPU之间混合计算#默认情况下,GPU支持的BLAS例程完全在GPU上运行#选项NVBLAS_CPU_RATIO_<BLAS_ROUTINE>给出比率[0,1]#应该在CPU上完成的计算量#注意:应该明智地使用此选项,因为它实际上可以#如果给CPU太多工作,则会显著降低总体性能#NVBLAS_CPU_RATIO_CGEMM 0.07