在ubuntu 16.04安裝tensorflow-gpu ,使用RTX 2080 Ti
Published in
5 min readJan 21, 2020
Install tensorflow-gpu on RTX 2080 Ti
GPU在深度學習運算是不可或缺的硬體,如果沒有GPU幫助,運算的時間會大幅上升,差的時間甚至到百倍。除了GPU外,CPU也是重要因素,因為並不是所有運算都是在GPU。此篇教學是幫助大家能在自己Local端電腦訓練神經網路。
網路上很多教學都會導致安裝2080ti失敗,經過很多次安裝失敗後,這篇教學可以幫助大家如何安裝tensorflow-gpu在ubuntu 16.04且避開很多雷。
- 首先先到anaconda首頁抓取sh檔案
https://www.anaconda.com/distribution/
- 抓的檔案是Anaconda3–4.3.1-Linux-x86_64.sh (2019/09/06)
執行此sh檔
bash Anaconda3-4.3.1-Linux-x86_64.sh
- 安裝完anaconda後,我們來安裝RTX 2080 Ti的驅動程式吧!
到這邊:https://www.geforce.com.tw/drivers
選擇適當的驅動程式。
- 下載後是一個run檔,像NVIDIA-Linux-x86_64–435.21.run (版本為435.21)
這邊可以改一下權限確保可以執行。
sudo chmod 755 NVIDIA-Linux-x86_64–435.21.run
- 接下來這個步驟要特別注意,20系列會有一些問題,如果直接執行run檔一定會有問題,最常見就是infinite loop login,就是會無限循環登入。如果之前已經安裝失敗過,就必須先把nvidia相關套件刪掉,若第一次安裝則可以略過此步驟。在終端機執行以下指令來清除相關套件。
sudo apt-get remove --purge nvidia-*
sudo apt-get autoremove
sudo nvidia-uninstall
- 接下來,必須,一定,要進入文本模式Ctrl + ALT +F1,不是terminal喔!整個畫面都會變成命令模式畫面。這是為了避掉20系列的bug,若在terminal下執行接下來的步驟,則會遇到循環登入的問題。
- 在文本模式下執行:
sudo service lightdm stop
執行sudo service lightdm stop就是關掉GUI,此時就無法回到桌面模式。
- 在文本模式下執行:
sudo ./NVIDIA-Linux-x86_64–435.21.run -no-x-check -no-nouveau-check -no-opengl-files
後面的參數一定要下-no-x-check -no-nouveau-check -no-opengl-files,執行後會出現一系列的選項。照著選就ok了。
- 在文本模式下執行:
sudo service lightdm restart
此時就可以回到桌面模式囉 :)
此階段可以重開機測試看看會不會出現循環登入。
- 進到桌面後,用anaconda套件安裝tensorflow-gpu版本,anaconda會自動幫你找尋適當版本Cudnn。
conda install tensorflow-gpu
- 大家可以看看是否有安裝成功!
nvidia-smi
看到以上畫面,確認驅動程式版本以及CUDA版本,表示你已經安裝成功囉!
- 接下來可以看看tensorflow有沒有讀到GPU!隨便開個notebook執行以下程式,若是回傳True就表示成功囉。
import tensorflow as tf
tf.test.is_gpu_available()
完工!
恭喜各位,此時就可以用GPU去做深度學習運算囉!
— —
— reference —
[1] https://blog.csdn.net/u012260117/article/details/82026006