nvidia-docker+cuda8.0+ubuntu16.04

nvidia-docker安装

      如果之前安装过docker1.0版本,需要先删掉该版本和之前创建的容器

  1. docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm -f
  2. sudo apt-get purge -y nvidia-docker   

      添加代码仓库

  1. curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
  2. sudo apt-key add -
  3. distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
  4. curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
  5. sudo tee /etc/apt/sources.list.d/nvidia-docker.list
  6. sudo apt-get update

      安装docker 2

         sudo apt-get install -y nvidia-docker2 sudo pkill -SIGHUP dockerd

  拉取镜像

        sudo nvidia-docker pull

    查看拉取镜像

       sudo nvidia-docker images

    文件挂载到镜像

         sudo nvidia-docker run -it –v path_local:/workspace  /bin/bash

这样就启动了一个容器,并且把目录挂载到了容器的/workspace下。这样操作的好处是,训练完的数据可以直接存放在宿主机,省略了从容器中拷贝的繁琐步骤。

cuda 安装

https://developer.nvidia.com/cuda-downloads中可以下载cuda。

1. 若下载run文件

终端中输入:

sudo sh cuda_8.0.61_375.26_linux.run
会报未知错误:The driver installation has failed due to an unknown error   Driver:   Installation Failed,网上没找到解决方法,放弃了,使用第二种方法。

2. 若下载deb文件

使用如下命令安装:

sudo dpkg -i cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64.deb,

对这句说明下,若无sudo命令,用apt-get install sudo 安装即可。运行过程中,可能会报错,can not install due to decompressor pipe: unexpected end of file or stream,可能解压没成功,多重复操作几次,我连续执行此命令三次,最终成功了。

sudo apt-get update
sudo apt-get install cuda

 之后编辑.bashrc:

gedit .bashrc
但是docker容器内无法编辑,会出现

Failed to connect to Mir: Failed to connect to server socket: No such file or directory
Unable to init server: Could not connect: Connection refused

暂时使用临时环境,输入:

export PATH=/usr/local/cuda-8.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/bin/lib64:$LD_LIBRARY_PATH

之后终端中输入:

nvcc --version
显示:
Cuda compilation tools, release 8.0, V8.0.44
posted @ 2019-03-19 20:53  胡里糊涂  阅读(1976)  评论(0编辑  收藏