Linux非root用户安装tensorflow1.12.0-gpu cuda9.0 cudnn7.5.0
- 简介
- 安装Anaconda
- 安装tensorflow-gpu 1.12.0
- 安装cuda9.0和cudnn7.5.0
- 验证安装是否成功
简介
??最近做的项目需要使用GPU做深度学习训练任务,查询一些资料后,成功安装配置tensorflow-gpu,以下是我在安装过程中的一些经验。
安装Anaconda
??Anaconda它是一种功能强大的环境管理器,可以方便地管理和切换不同的环境管理器python在做深度学习任务时,建议安装环境。Anaconda这里下载网站,根据系统配置选择相应的下载。例如,我的系统是RHEL7,就选择Linux_64_x86下载。
安装tensorflow-gpu 1.12.0
??Anaconda安装完成后,可以创建新的python环境如下:
conda create -n tensorflow python=3.5
??这样,一个名字就被创建了,python版本为3.5的新环境。-n后面是环境名,python版本也可以自己选择。conda删除环境的命令如下:
conda remove -n tensorflow --all
??创建环境后,使用以下命令进出环境:
conda activate tensorflow conda deactivate
??进入可在环境后使用pip来下载相应的package,比如需要的tensorflow-gpu1.12.使用国内清华镜像源下载速度更快:
pip install tensorflow-gpu==1.12.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
??package下载后,您可以使用以下命令检查安装是否成功:
pip list
安装cuda9.0和cudnn7.5.0
??安装cuda9.在确认主机上有可用性之前GPU,然后检查Nvidia使用以下命令:
cat /proc/driver/nvidia/version
??存在Nvidia如果显卡输出上述信息,驱动版本为390.25.查阅驱动版和cuda选择相应的关系表后cuda9.0和cudnn7.5.0下载。如果主机上没有Nvidia驱动需要下载和安装Nvidia驱动。对应表格如下: ??cuda下载网站,根据显卡驱动版本和系统选择相应的下载,最后选择runfile版本。cudnn下载网站需要先创建Nvidia Developer只有在以下载后,注意和谐cuda匹配主机操作系统的版本。 ??下载完成后,使用命令进行安装cuda和cudnn:
sh NVIDIA-Linux-x86_64-384.183.run(下载的cuda包)
rpm2cpio libcudnn7-7.5.0.56-1.cuda9.0.x86_64.rpm | cpio -dvim(下载的cudnn包,根据不同的格式使用不同的解压命令,我在这里下载Red Hat系统的rpm包)
??因为我们的安装是在非root所以在安装的权限下cuda在此过程中,需要设置自己的安装路径,如/home/用户名/cuda-9.0;此外cuda还需要设置安装过程sample例如/home/用户名/cuda-sample。其他需要在安装过程中使用root权限选择即可,如driver驱动安装选择no
。cudnn包解压后,需要将目录下的库文件复制到cuda目录下并修改权限: ??cp cudnn/include/cudnn.h cuda-9.0/include/
??cp cudnn/lib64/libcudnn* cuda-9.0/lib64
??chmod a r cuda-9.0/include/cudnn/h cuda-9.0/lib64/libcudnn*
然后修改用户的环境变量,输入/home/用户名/.bashrc添加以下句子: ??export PATH=$HOME/cuda-9.0/bin:$PATH
??export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$HOME/cuda-9.0/lib64/
修改之后source ~/.bashrc
使环境变量生效。
验证安装是否成功
??使用nvcc -V
命令可以检查安装情况cuda版本,以后用conda activate tensorflow
进入指定python环境。输入python
后进入python开发环境,输入import tensorflow
,如果没有错误,则不会输出信息;如有错误,根据错误信息进行检查tensorflow,cuda,cudnn版本是否匹配。