前言
當我們安裝完nvidia 的driver後, 理論上使用nvidia-smi 應該要看到GPU的使用狀況如下
但如果是看到以下這個錯誤訊息, 表示NVidia的driver沒有成功裝起來
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running
網路上的解法很多1. 確認是否有插入顯卡
$ lspci | grep 'VGA'
如果系統有找到卡的話, 會顯示顯卡資訊
2. 確認security boot是否為disable的狀態
> 開機時, 進入Bios 設定畫面(若是Acer的電腦, 按Del 或是F2 即可進入Bios)
> 改成disable 後, 重開機再試看看
> 如果以上都不行, 那就只能試試大絕招了: 更新系統內核(kernel)
3. 確認kernel版本是否大於4.10
$ uname -a結果如下, 目前內核版本是 4.15
若版本小於4.10, 那就必須升級
方法一: 下載內核然後安裝
wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.15.7/linux-headers-4.15.7-041507_4.15.7-041507.201802280530_all.deb wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.15.7/linux-headers-4.15.7-041507-generic_4.15.7-041507.201802280530_amd64.deb wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.15.7/linux-image-4.15.7-041507-generic_4.15.7-041507.201802280530_amd64.deb sudo dpkg -i *.deb
升級完後再重新安裝 Nvidia Driver
方法二: 直接升級到Ubuntu 18.0
$ sudo do-release-upgrade -d
補充:
解除Nvidia Driver的方法
$ sudo apt-get remove --purge '^nvidia-.*'
最後, 希望大家看完這篇文章後, 可以順利地解決問題~
大大您好,我們研究室目前也遇到一樣的問題,使用的是2080Ti
回覆刪除目前kernel版本是4.15.45,nvidia驅動版本是410
已經試過kernel降版/升版,還有驅動也有重裝過,但都無法使用
想請教一下大大還有沒有別的方法?
你有試過重新灌Ubuntu 18 然後先不要更新系統,然後直接安裝驅動嗎 ubuntu-drivers autoinstall
刪除可以分享你安裝的整個過程嗎,
第一步,第二步,
嘗試看看:
刪除sudo prime-select nvidia
如果出現TypeError: a bytes-like object is required, not 'str',那麼就是python的問題,請把python的預設版本調回python2.7,你應該是用update-alternatives管理python版本的吧?是的話輸入以下指令:
sudo update-alternatives --install /usr/bin/python python /usr/bin/python2.7 [取代成比較大的數字]
這會讓python 預設版本回到python2.7,此時重新安裝nvidia-driver看看吧
相同問題 我本來是成功的的(ppa)安裝的 結果隔天重開機就不行用了 kernel 4.15.0 nvidia 418 415都灌過無法 1060 gpu
回覆刪除你有試過使用nvidia-smi 檢查驅動是否有成功裝起來嗎?我好像有遇過類似的,當時我是直接再重灌一次系統,用乾淨的環境去裝
刪除