本文针对Ubuntu 16.04 LTS版本。
在Shell中运行命令:
lspci | grep -i nvidia查看GPU型号,然后在https://developer.nvidia.com/cuda-gpus页面中查找设备的GPU是否在支持CUDA的列表中。
gcc --version对于Ubuntu 16.04来说,gcc版本需要>5.4.0。
uname -r对于Ubuntu 16.04来说,内核版本需要>4.4.0。
然后需要安装对应版本的Kernel Header:
sudo apt-get install linux-headers-$(uname -r)sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev \
libboost-all-dev libhdf5-serial-dev libgflags-dev libgoogle-glog-dev liblmdb-dev \
protobuf-compiler g++ freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev \
libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev运行
lsmod | grep nouveau如果有显示内容,则说明Nouveau驱动正在运行,需要根据教程关闭Nouveau。
在NVIDIA驱动下载页面按照自己的GPU型号、系统以及CUDA版本选择驱动并进行下载,得到诸如nvidia-diag-driver-local-repo-ubuntu1604_3XY.AB-1_amd64.deb的文件/
然后运行以下命令:
sudo dpkg -i nvidia-diag-driver-local-repo-ubuntu1604_3XY.AB-1_amd64.deb(XY.AB需要根据下载版本进行修改)
sudo apt-get update
sudo apt-get install cuda-drivers
sudo reboot完成后系统会进行重启,在重启前请保存所有运行的工作。
重启后运行
sudo nvidia-smi
如果正常输出显卡状态说民驱动安装成功。
在CUDA下载页面下载Runfile形式的CUDA安装包,形式为cuda_9.0.176_384.81_linux.run
具体CUDA和cuDNN版本参考TensorFlow安装要求,对于r1.10版本来说支持的CUDA版本为9.0。
(选做)
对于有GUI的系统来说,需要在启动时按下Ctrl + Alt + F1/F4进入tty1/tty4模式,然后输入:
sudo service lightdm stop停止GUI运行。
开始安装CUDA。
sudo sh cuda_9.0.176_384.81_linux.run- 一路按空格,输入
accept同意用户协议 - 安装程序询问是否安装驱动,输入
no - 询问是否安装CUDA Toolkit,输入
yes - 更改CUDA Toolkit安装位置,这里不作修改
- 是否创建/usr/local/cuda符号链接,如果只安装一个CUDA版本,输入'yes'
- 询问是否安装CUDA Samples,输入'yes'
- 更改CUDA Samples安装位置,这里不作修改
如果没有报错,则说明安装成功。如果提示:
Installing the CUDA Toolkit in /usr/local/cuda-8.0 …
Missing recommended library: libGLU.so
Missing recommended library: libX11.so
Missing recommended library: libXi.so
Missing recommended library: libXmu.so
则需要安装依赖库:
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev然后重新运行CUDA安装程序即可。
运行
sudo vi /etc/profile用vi编辑启动脚本。用方向键将光标定位至文件末尾然后按i插入以下内容:
export PATH=$PATH:/usr/local/cuda-9.0/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64:/usr/local/cuda-9.0/extras/CUPTI/lib64
在Shell中运行:
export PATH=$PATH:/usr/local/cuda-9.0/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64:/usr/local/cuda-9.0/extras/CUPTI/lib64运行
cat /proc/driver/nvidia/version查看驱动版本。
运行
nvcc -V i查看nvcc版本。
按照教程运行示例。
在cuDNN下载页面下载TensorFlow支持的cuDNN版本,目前支持的是cuDNN v7。在下载时需要注册NVIDIA账号和开发者账号。
下载后得到一个诸如cudnn-9.0-linux-x64-v7.tgz的压缩包。
运行:
tar -xvzf cudnn-9.0-linux-x64-v7.tgz进行解压,在当前目录得到cuda文件夹。
然后运行
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*将cuDNN拷贝至CUDA目录中。
可以按照官方教程来验证cuDNN的安装。
如果没安装pip,则需要安装pip:
sudo apt-get install python3-pip python3-dev然后尝试从官方源下载安装TensorFlow:
pip3 install tensorflow-gpu如果安装缓慢或者网络错误,请尝试将源切换至清华大学提供的:
pip3 install tensorflow-gpu -i https://pypi.tuna.tsinghua.edu.cn/simple接下来验证安装:
在Shell或者IDE中运行代码:
# Python Code
import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
print(sess.run(hello))等待,如果能够正常输出
Hello, TensorFlow!
说明安装成功。如果输出错误信息,可以参考官方文档解决。
帮大忙了,找了好久的资料终于弄好了