Docker中常用操作总结(包括搭建深度学习环境）

敢敢のwings

发布时间 2021.09.29阅读数 5716 评论数 0

0. 前言

ubuntu下安装cuda、cuddn等NVIDIA机器学习、深度学习环境往往是在使用Linux中最头疼的配置步骤，同时，由于nvidia的cuda、cuddn版本众多，这让统一环境开发成为了难点。而Nvidia官方也认清楚了这一点，并基于docker开发了nvidia docker并且提供cuda镜像，这让我们完全不用考虑环境问题了

环境：
ubuntu20.04
docker 19.03

1. 安装docker

1.查看ubuntu内核

uname -r

2.安装docker

sudo apt-get install docker.io

3.查看版本

docker version 或 docker -v

4.启动

sudo systemctl unmask docker.service
sudo systemctl unmask docker.socket
sudo systemctl start docker.service

5.查看状态

sudo systemctl status docker

2. 修改docker源

sudo gedit /etc/docker/daemon.json

添加以下内容：(使用阿里源)

{

    "registry-mirrors":[
         "https://emasu4pd.mirror.aliyuncs.com",
         "http://hub-mirror.c.163.com"
    ],
    "runtimes": {

        "nvidia": {

            "path": "/usr/bin/nvidia-container-runtime",
            "runtimeArgs": []
        }
    }
}

3. 从官网镜像获取镜像文件

拉取镜像（上海服务器）

docker pull registry.cn-shanghai.aliyuncs.com/tcc-public/super-mario-ppo:race

启动容器后台运行

docker run -id registry.cn-shanghai.aliyuncs.com/tcc-public/super-mario-ppo:race

查看容器内的文件

docker ps

结果如下

CONTAINER ID    IMAGE       COMMAND       CREATED     STATUS        PORTS           NAMES
3d747e7ccb2b 12f1b1d66471e "/bin/bash"  5 seconds ago  Up 7 seconds       xenodochial_dewdne

这个ID很重要，接下来ls 进入这个容器。

docker exec -it 3d747e7ccb2b /bin/bash

root@3d747e7ccb2b:/workspace#
root@3d747e7ccb2b:/workspace# ls

__pycache__  core_lstm.py  env.py  gym-results  ppo_lstm.py  pretrain  spinningup  test_lstm.py

退出这个容器只需要exit即可。

root@3d747e7ccb2b:/workspace# exit  #输入exit命令退出当前容器或按ctrl+D退出当前容器

4. 拷贝并更新回容器-本地更新

建立一个文件夹用来存储这些文件。

将该ID容器里的文件拷贝到你创建的文件夹中。

docker cp 3d747e7ccb2b:/workspace/ppo_lstm.py E:/tianchi_rl_submit/

将修改后的拷贝文件拷贝回容器

docker cp E:/tianchi_rl_submit/ppo_lstm.py 3d747e7ccb2b:/workspace/

更新镜像（自己的），这里是深圳服务器。

docker commit 3d747e7ccb2b registry.cn-shenzhen.aliyuncs.com/docker_tanchi/rl_submit:race

查看生成的镜像

docker images

REPOSITORY                                                  TAG       IMAGE ID       CREATED         SIZE
registry.cn-shenzhen.aliyuncs.com/docker_tanchi/rl_submit   race      12f1b1d66471   3 hours ago     11.2GB
registry.cn-shanghai.aliyuncs.com/tcc-public/python         3         a4cc999cf2aa   20 months ago   929MB

如此操作，大概理解了流程，这里都是本地的更新过程，那么再回顾官方的教程复习一遍，官方教程是完整的上传到个人仓库的一个过程。

将镜像打包成tar包

docker  save  -o xxx.tar  imagexxx # 当前路径下会生成一个xxx.tar

将tar包生成镜像

docker  load  <  xxx.tar     # 生成的镜像跟之前打包的镜像名称一样

5. 官方教程-上传到仓库

输入用户名和密码

sudo docker login --username=xxxx

修改镜像标记，必须为自己注册账号的用户名开头

#docker tag [OPTIONS] IMAGE[:TAG] [REGISTRYHOST/][USERNAME/]NAME[:TAG]
sudo docker tag [ImageId] registry.cn-hangzhou.aliyuncs.com/egg_mario/mario:[镜像版本号]

将镜像推送到Registry

sudo docker push registry.cn-hangzhou.aliyuncs.com/egg_mario/mario:[镜像版本号]

在输入docker images后可以看到对应的TAG和IMAGE ID

如果提示denied: requested access to the resource is denied，那么再运行一下login即可。

6. nvidia-docker安装

开启docker服务

sudo systemctl --now enable docker

引入nvidia-docker源：

distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
   && curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - \
   && curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

更新源：

sudo apt update

安装nvidia-docker，重启docker服务:

sudo apt-get install nvidia-docker2
sudo systemctl restart docker

镜像载入
用以下指令载入一个带有cuda的镜像（启动命令中添加参数：–gpus all 或 —gpus “device=1”指定）：

sudo docker run --rm --gpus all nvidia/cuda:10.0-base nvidia-smi

如果出现下图，则nvidia-docker安装成功：
然后将需要的包全部安装好，然后打包成镜像，并发布。

7. 参考链接

https://www.i4k.xyz/article/liuzhuomei0911/115176455
https://blog.csdn.net/weixin_45385568/article/details/115140719

Docker CUDA CUDNN

原创文章作者：敢敢のwings。如若转载，请注明出处：古月居 http://admin.guyuehome.com/35486

打赏 0

上一篇：ROS2 DDS通信漫谈

下一篇：使用Colab对wget下载加速

Docker中常用操作总结(包括搭建深度学习环境）

敢敢のwings

0. 前言

1. 安装docker

2. 修改docker源

3. 从官网镜像获取镜像文件

4. 拷贝并更新回容器-本地更新

5. 官方教程-上传到仓库

6. nvidia-docker安装

7. 参考链接

为你推荐

精选隐写术之JPEG隐写——F5算法 & Jsteg算法

[论文阅读笔记01]DOI：10.18653/v1/2021.acl-long.73（下）

人脸识别实战：使用Opencv+SVM实现人脸识别

第二天 自制数据集，使用yolov5-3.1和yolov5-6.1分别训练对比，验证测试结果

精选3维数据旋转 matplotlib 可视化

初识对抗生成网络(GAN)

评论（0）

关于作者

敢敢のwings

361

2

801

17

一看就懂的单目特征点恢复深度信息（三角化）

经典文献阅读之--Lifelong SLAM(变化环境中Lifelong定位建图)

C++(ROS) 之 perf+火焰图分析与Debug

相关推荐

机器学习笔记_关于贝叶斯分类中特征是连续属性的处理

头盔佩戴检测（行人跟踪技术检测）

精选学习笔记——SA求解旅行商问题的理解与代码分析

单阶段实例分割综述

Tensorflow学习实战之单变量线性预测

KMeans+DBSCAN密度聚类+层次聚类的使用（附案例实战）

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

TA的专栏

dlo系列

轨迹规划

大模型

Matlab-ros

深度学习

CUDA

FAST-LIO系列

规范学习

机器人仿真

传感器感知

ROS基础以及进阶

无人驾驶

从零到一的SLAM

机器人基础知识

经典论文阅读

C++模式

专栏导航

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

第二天自制数据集，使用yolov5-3.1和yolov5-6.1分别训练对比，验证测试结果

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板