在ubuntu 16.04安裝tensorflow-gpu ,使用RTX 2080 Ti

Darren Wang
Taiwan AI Academy
Published in
5 min readJan 21, 2020

Install tensorflow-gpu on RTX 2080 Ti

Photo by Artiom Vallat on Unsplash

GPU在深度學習運算是不可或缺的硬體,如果沒有GPU幫助,運算的時間會大幅上升,差的時間甚至到百倍。除了GPU外,CPU也是重要因素,因為並不是所有運算都是在GPU。此篇教學是幫助大家能在自己Local端電腦訓練神經網路。

網路上很多教學都會導致安裝2080ti失敗,經過很多次安裝失敗後,這篇教學可以幫助大家如何安裝tensorflow-gpu在ubuntu 16.04且避開很多雷。

Anaconda3–4.3.1-Linux-x86_64.sh
  • 抓的檔案是Anaconda3–4.3.1-Linux-x86_64.sh (2019/09/06)
    執行此sh檔
bash Anaconda3-4.3.1-Linux-x86_64.sh
  • 下載後是一個run檔,像NVIDIA-Linux-x86_64–435.21.run (版本為435.21)
    這邊可以改一下權限確保可以執行。
sudo chmod 755 NVIDIA-Linux-x86_64–435.21.run
  • 接下來這個步驟要特別注意,20系列會有一些問題,如果直接執行run檔一定會有問題,最常見就是infinite loop login,就是會無限循環登入。如果之前已經安裝失敗過,就必須先把nvidia相關套件刪掉,若第一次安裝則可以略過此步驟。在終端機執行以下指令來清除相關套件。
sudo apt-get remove --purge nvidia-* 
sudo apt-get autoremove
sudo nvidia-uninstall
  • 接下來,必須,一定,要進入文本模式Ctrl + ALT +F1,不是terminal喔!整個畫面都會變成命令模式畫面。這是為了避掉20系列的bug,若在terminal下執行接下來的步驟,則會遇到循環登入的問題。
  • 在文本模式下執行:

sudo service lightdm stop

執行sudo service lightdm stop就是關掉GUI,此時就無法回到桌面模式。

  • 在文本模式下執行:
sudo ./NVIDIA-Linux-x86_64–435.21.run -no-x-check -no-nouveau-check -no-opengl-files

後面的參數一定要下-no-x-check -no-nouveau-check -no-opengl-files,執行後會出現一系列的選項。照著選就ok了。

  • 在文本模式下執行:
sudo service lightdm restart

此時就可以回到桌面模式囉 :)
此階段可以重開機測試看看會不會出現循環登入。

  • 進到桌面後,用anaconda套件安裝tensorflow-gpu版本,anaconda會自動幫你找尋適當版本Cudnn。
conda install tensorflow-gpu
  • 大家可以看看是否有安裝成功!
nvidia-smi

看到以上畫面,確認驅動程式版本以及CUDA版本,表示你已經安裝成功囉!

  • 接下來可以看看tensorflow有沒有讀到GPU!隨便開個notebook執行以下程式,若是回傳True就表示成功囉。
import tensorflow as tf
tf.test.is_gpu_available()

完工!

恭喜各位,此時就可以用GPU去做深度學習運算囉!

— —

— reference —

[1] https://blog.csdn.net/u012260117/article/details/82026006

--

--