跳到主要內容

發表文章

目前顯示的是有「nvidia」標籤的文章

如何在Container裡使用GPU

How to use GPU in docker container 前言 基本上原生的docker 容器是無法使用GPU資源 解決方法 必須使用NVIDIA的 Docker才可以讓容器吃到GPU的資源 以下是在Ubuntu上的安裝步驟 Step 1. (Optional) 安裝驅動 如果GPU的驅動已經裝好了化可以先略過這一步 sudo ubuntu-drivers autoinstall 安裝完之後可以用以下指令確認有沒有裝成功 nvidia-smi Step 2.  安裝 CUDA CUDA是個運算架構能夠輕易地時線平行運算 wget https://gist.githubusercontent.com/acerkr71a/29ecd032eeb178888fec0bb7660cc3bf/raw/03df656e945d7c56ee2d454e0ea83796e8eacfeb/install-cuda.sh && chmod +x installer.sh && ./installer.sh Step 3. 安裝NVIDIA 的 Docker wget https://gist.githubusercontent.com/acerkr71a/7c19e940f4029d86476309d63950d750/raw/a7f368c800b4ef2e23559ef5f13f97a540dc4499/install-nvidia-docker.sh && chmod +x docker-installer.sh && ./docker-installer.sh

[簡易教學]快速建立深度學習的環境 CUDA + Tensorflow + nvidia docker

前言 若想把深度學習的程式碼跑在獨立的環境裡面, 最好的方法就是用docker container來隔離每隻程式, docker的好處這便就不再贅述, 以下示範完整安裝過程 Step 1. 安裝NVidia驅動程式 一開始可以先用ubuntu-drivers devices列出你的顯卡需要裝什麼驅動, 如果沒有特別的偏好, 直接用 autoinstall來裝就可以了 ubuntu-drivers devices sudo ubuntu-drivers autoinstall 安裝完後建議重開機 Step 2. 檢查是否安裝成功 nvidia-smi 可以用來監測GPU的使用率 nvidia-smi 如果驅動有安裝成功, 基本上可以到目前GPU的使用狀況 Step 3. 安裝 CUDA & CUDNN # Add NVIDIA package repository sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_9.1.85-1_amd64.deb sudo apt install ./cuda-repo-ubuntu1604_9.1.85-1_amd64.deb wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1604/x86_64/nvidia-machine-learning-repo-ubuntu1604_1.0.0-1_amd64.deb sudo apt install ./nvidia-machine-learning-repo-ubuntu1604_1.0.0-1_amd64.deb sudo apt update # Install CUDA and tools...

[解決方法] NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.

前言 當我們安裝完nvidia 的driver後, 理論上使用nvidia-smi 應該要看到GPU的使用狀況如下 但如果是看到以下這個錯誤訊息, 表示NVidia的driver沒有成功裝起來 NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running 網路上的解法很多  1. 確認是否有插入顯卡 $ lspci | grep 'VGA' 如果系統有找到卡的話, 會顯示顯卡資訊  2. 確認security boot是否為disable的狀態     > 開機時, 進入Bios 設定畫面(若是Acer的電腦, 按Del 或是F2 即可進入Bios)   >  改成disable 後, 重開機再試看看   >  如果以上都不行, 那就只能試試大絕招了: 更新系統內核(kernel)  3. 確認kernel版本是否大於4.10 $ uname -a 結果如下, 目前內核版本是 4.15 若版本小於4.10, 那就必須升級 方法一: 下載內核然後安裝 wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.15.7/linux-headers-4.15.7-041507_4.15.7-041507.201802280530_all.deb wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.15.7/linux-headers-4.15.7-041507-generic_4.15.7-041507.201802280530_amd64.deb wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.15.7/linux-image-4.15.7-041507-gene...