【RancherLab】如何快速将容器云镜像大小精简98%?
如何快速将容器云镜像大小精简98%?
以下文章来源于CSDN云计算 ,作者阿木
接触过容器云或者用过容器的用户,想必都遇到容器镜像占用空间很大的问题,遇到此类问题的时候,大部分人可能更加习惯于为容器的镜像仓库增加磁盘空间。当然这种方式无可厚非,毕竟这种方式可以帮助我们快速的解决掉手里的问题。
除了上面扩磁盘的解决方式,其实我们还可以采用缩减容器镜像的方式。此种方式不但可以帮助我们节省添加新磁盘的开支,还可减少我们制作镜像和传输镜像的时间。优化的比较好的镜像占用的空间,基本和应用的文件占用的空间相当,基本不会占用太多的额外存储空间。
下文中,我们会具体看看如何快速精简容器云镜像。

接触过Docker 的同学都知道,Dockerfile 是由一些指令的组成,且Dockerfile 文件中的每条指令对应着Linux 操作系统中的一条命令,当我们构建镜像时,Docker 程序会将这些Dockerfile指令翻译成Linux可执行的命令。
Dockerfile 中每一条指令都会创建一个镜像层,随着指令的执行继而会增加镜像整体的大小。
常用Dockerfile指令
Dockerfile 文件有自己的书写格式和支持的命令,常用的Dockerfile 指令有:
-
FROM 指定基镜像。
-
MAINTAINER 设置镜像的作者信息,如作者姓名、邮箱等。
-
COPY 将文件从本地复制到镜像,拷贝前需要保证本地源文件存在。
-
ADD 与 COPY 类似,复制文件到镜像。不同的是,如果文件是归档文件(tar, zip, tgz, xz 等),会被自动解压。
-
ENV 设置环境变量,格式: ENV key=value或ENV key value,运行容器后,可直接在容器中使用。
-
EXPOSE 暴露容器中指定的端口,只是一个声明,主要用户了解应用监听的端口。
-
VOLUME 挂载卷到容器,需要注意的是,保存镜像时不会保存卷中的数据。
-
WORKDIR 设置当前工作目录,后续各层的当前目录都被指定。
-
RUN 在容器中运行指定的命令。
-
CMD 容器启动时运行的命令。Dockerfile 中可以有多个 CMD 指令,但只有最后一个生效。CMD 可以被 docker run 之后的参数替换。
-
ENTRYPOINT 设置容器启动时运行的命令。Dockerfile 中可以有多个 ENTRYPOINT 指令,但只有最后一个生效。CMD 或 docker run 之后的参数会被当做参数传递给 ENTRYPOINT,这个是与CMD的区别。
精简镜像的好处不言而喻,可以节省存储存储空间,更可以减少镜像传输时间,减少带宽的消耗,加快传输。
容器镜像的基本理论
在开始制作镜像之前,我们先了解一下容器镜像的基本理论知识。
容器镜像中最重要的概念就是layers,即镜像层。
镜像层依赖于一系列的底层技术,比如文件系统(filesystems)、写时复制(copy-on-write)、联合挂载(union mounts)等技术,这些技术的细节在此我们不再赘述,感兴趣的同学可以直接直接查看Docker 官方文档(https://docs.docker.com/storage/storagedriver/)进行学习。
总的来说,精简镜像我们最需要记住的一句话是:
“在Dockerfile中,每条指令都会创建一个镜像层,继而会增加镜像整体的大小。”
下面我们以一个示例来说明一下:
我们pull 一个镜像,以busybox为例:
[root@work ~]# docker pull hub.c.163.com/library/busybox:latest Trying to pull repository hub.c.163.com/library/busybox ... latest: Pulling from hub.c.163.com/library/busybox aab39f0bc16d: Pull compl`ete Digest: sha256:662af1d642674367b721645652de96f9c147417c2efb708eee4e9b7212697762 Status: Downloaded newer image for hub.c.163.com/library/busybox:latest
# 看下镜像大小
[root@work ~]# docker images | grep busybox hub.c.163.com/library/busybox latest d20ae45477cb 18 months ago 1.129 MB
从上面结果看我们pull下来的镜像大小只有1.129MB。
下面我们编写一个Dockerfile文件,文件中我们新建一个目录,目录中新建一个100MB的文件,最后我们删掉新建的文件。
Dockerfile 内容如下:
#基镜像 FROM hub.c.163.com/library/busybox:latest #新建目录 RUN mkdir /tmp/dir1 #新建一个100MB的文件 RUN dd if=/dev/zero of=/tmp/dir1/file1 bs=1M count=100 #删除文件 RUN rm /tmp/dir1/file1
从Dockerfile 内容看,其实我们基本什么都没干。
然后我们用这个Dockerfile构建新建的镜像,并查看新镜像的大小:
[root@work ~]# docker build -t busybox:v1 . Sending build context to Docker daemon 1.307 GB Step 1 : FROM hub.c.163.com/library/busybox:latest ---> d20ae45477cb Step 2 : RUN mkdir /tmp/dir1 ---> Running in 63fa5f27c779 ---> da95ea8ae5ee Removing intermediate container 63fa5f27c779 Step 3 : RUN dd if=/dev/zero of=/tmp/dir1/file1 bs=1M count=100 ---> Running in d3e8bbb4f151 100+0 records in 100+0 records out 104857600 bytes (100.0MB) copied, 0.247500 seconds, 404.0MB/s ---> 42b721238144 Removing intermediate container d3e8bbb4f151 Step 4 : RUN rm -rf /tmp/dir1/file1 ---> Running in 6b51b633fb21 ---> 04096cc5d718 Removing intermediate container 6b51b633fb21 Successfully built 04096cc5d718
# 查看镜像信息 [root@work ~]# docker images | grep busybox busybox v1 04096cc5d718 58 seconds ago 106 MB hub.c.163.com/library/busybox latest d20ae45477cb 18 months ago 1.129 MB
从上面的结果可以看出,虽然在Dockerfile中我们将新建的100MB的文件删除了,但新镜像的大小仍大于100MB。
多出了100多MB,这是为何?其实这点和git类似,Docker镜像和git都用到了写时复制技术,git每次提交时都会保存一个文件的版本,Dockerfile每行指令都会增加整体镜像的大小,即使我们什么都没做。
如何进行容器镜像精简
下面我们开始说下本文的重点:镜像精简。
我们将以最常见的nosql数据库Redis为例,一步步来介绍如何制作更精简的Docker 镜像。
首先我们来编写一下构建Redis镜像的Dockerfile文件,具体内容如下:
FROM hub.c.163.com/library/ubuntu:trusty #redis 版本 ENV VER 3.0.0 ENV TARBALL http://download.redis.io/releases/redis-$VER.tar.gz RUN apt-get update #安装依赖的工具 RUN apt-get install -y curl make gcc #下载redis源码包并解压 RUN curl -L $TARBALL | tar zxv #进入解压后的目录 WORKDIR redis-$VER #编译redis源码 RUN make #安装redis RUN make install WORKDIR / #清理前面安装的依赖工具 RUN apt-get remove -y --auto-remove curl make gcc RUN apt-get clean RUN rm -rf /var/lib/apt/lists/* /redis-$VER #运行redis CMD ["redis-server"]
然后再利用上面的Dockerfile 构建镜像:
[root@work ~]# docker build -t redis:3.0.0 . …… …… Removing intermediate container b55656487022 Successfully built 7df9c7899ae3
查看构建出的镜像大小:
[root@work ~]# docker images | grep redis redis 3.0.0 7df9c7899ae3 10 hours ago 359.7 MB
从结果看构建出优化前的镜像约为360MB。
下面我们将开始逐步优化。

1. 选用更小的基镜像
常用的linux系统一般有CentOS、Debian、Ubuntu,三者中Debian更轻量,且Debian系统镜像中提供的功能一般也是够用的,三个系统镜像尺寸对比如下:

在此我们以上面最小的镜像debian:wheezy 作为即镜像,重新进行构建:
Dockerfile内容:
FROM hub.c.163.com/library/debian:wheezy #redis 版本 ENV VER 3.0.0 ENV TARBALL http://download.redis.io/releases/redis-$VER.tar.gz RUN apt-get update #安装依赖的工具 RUN apt-get install -y curl make gcc #下载redis源码包并解压 RUN curl -L $TARBALL | tar zxv #进入解压后的目录 WORKDIR redis-$VER #编译redis源码 RUN make #安装redis RUN make install WORKDIR / #清理前面安装的依赖工具 RUN apt-get remove -y --auto-remove curl make gcc RUN apt-get clean RUN rm -rf /var/lib/apt/lists/* /redis-$VER #运行redis CMD ["redis-server"]
构建新镜像:
[root@work ~]# docker build -t redis:3.0.0-v2 . …… …… Removing intermediate container 3498689792ce Successfully built 4faa1aa0936d
对比两个镜像大小:

从结果看,更换基镜像后的新镜像减少了37%,精简效果还算可以,但精简效果并未达到我们的目标。
如果仔细看的话我们会发现,原本只有85MB大小的debian基镜像,在构建后增加到了228MB,可见此处还有很大的优化空间。后续的优化就需要用到我们在上文中说到的镜像层相关的知识了。

2. 合并Dockerfile中指令
Dockerfile 中指令的合并一般是指RUN指令的合并。
我们可以通过&&符号和/ 将Dockerfile 中的多个RUN指令合并成一条RUN 指令,此种方式一般精简效果较好。
优化后的Dockerfile 内容如下:
FROM hub.c.163.com/library/debian:wheezy #redis 版本 ENV VER 3.0.0 ENV TARBALL http://download.redis.io/releases/redis-$VER.tar.gz RUN apt-get update && \ apt-get install -y curl make gcc &&\ curl -L $TARBALL | tar zxv && \ cd redis-$VER && \ make && \ make install && \ cd / && \ apt-get remove -y --auto-remove curl make gcc && \ apt-get clean && \ rm -rf /var/lib/apt/lists/* /redis-$VER #运行redis CMD ["redis-server"]
构建新镜像:
[root@work ~]# docker build -t redis:3.0.0-v3 . …… …… Removing intermediate container 9e5cffcd8bdb Successfully built dafd91993dfb
查看镜像大小:

从结果看镜像大小约缩减72%,可见合并Dockerfile指令的方式精简效果较明显,新镜像只比基镜像增加约10MB。
合并Dockerfilec指令精简镜像这种方式是最常用的精简镜像尺寸的方式。
3. 使用最精简的基镜像
上文中第1步中,我们使用的基镜像为Debian镜像,约89MB,但如果我们只是安装Redis 服务的话不一定非得使用这么大的系统镜像,我们可以借助一些更小的镜像,如scratch、busybox、alpine等,这些镜像大小往往小于5MB,因此我们可以直接以此作为基镜像来构建新的Redis镜像。
此处我们以scratch作为基镜像构建Redis。scratch镜像往往只有1~5MB大小。
Scrach 是一个空镜像,只能用于构建镜像。在构建一些基础镜像,如debian、busybox时非常有用。Scrach也常用于构建超小的镜像,如构建一个只包含所有库的二进制文件。
但使用最精简的基镜像,我们还需要做些额外的工作,具体过程见下文。
4. 提取.so库
了解过Redis源码的话大家会知道Redis 开发语言为C语言,会依赖一些.so库,因此我们需要先准备好编译Redis 所需的.so文件。
我们通过前面构建好的redis:3.0.0-v3镜像运行容器,然后进入容器中获取下redis依赖的.so文件。
# 后台运行容器:
[root@work ~]# docker run --name redisv3 -d redis:3.0.0-v3 ab361e7fc2e70b5b45fa1545917ee92158bb859e833c3f7fcfb80e43bb69cb0c
# 查看容器运行状态

# 进入容器
[root@work ~]# docker exec -ti redisv3 /bin/bash
root@ab361e7fc2e7:/#
# 查看redis-server 二进制文件位置
root@ab361e7fc2e7:/# which redis-server /usr/local/bin/redis-server
# 查看redis-server依赖的.so文件
root@ab361e7fc2e7:/# ldd /usr/local/bin/redis-server linux-vdso.so.1 => (0x00007ffedfd01000) libm.so.6 => /lib/x86_64-linux-gnu/libm.so.6 (0x00007f0de7a5e000) libdl.so.2 => /lib/x86_64-linux-gnu/libdl.so.2 (0x00007f0de785a000) libpthread.so.0 => /lib/x86_64-linux-gnu/libpthread.so.0 (0x00007f0de763d000) libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f0de72b0000) /lib64/ld-linux-x86-64.so.2 (0x00007f0de7ce4000)
将编译Redis 需要的所有依赖打包:
root@ab361e7fc2e7:/# mkdir so root@ab361e7fc2e7:/# cp usr/local/bin/redis-server so/ root@ab361e7fc2e7:/# cp lib/x86_64-linux-gnu/libm.so.6 so/ root@ab361e7fc2e7:/# cp lib/x86_64-linux-gnu/libpthread.so.0 so/ root@ab361e7fc2e7:/# cp lib/x86_64-linux-gnu/libc.so.6 so/ root@ab361e7fc2e7:/# cp lib64/ld-linux-x86-64.so.2 so/ root@ab361e7fc2e7:/# cd so root@ab361e7fc2e7:/# tar zcvf so.tar.gz ./* so/ so/redis-server so/libm.so.6 so/libpthread.so.0 so/libc.so.6 so/ld-linux-x86-64.so.2
# 将打包好的文件从容器拷贝出来:
[root@work ~]# docker cp redisv3:/so/so.tar.gz .
编写Dockerfile 文件,具体内容如下:
FROM scratch # 添加依赖的库文件 ADD so.tar.gz / # redis 配置文件,需要自己准备一份 COPY redis.conf /etc/redis/redis.conf # 暴露的端口 EXPOSE 6379 CMD ["redis-server"]
构建新镜像:
[root@work ~]# docker build -t redis:3.0.0-v4 . Sending build context to Docker daemon 1.316 GB Step 1 : FROM scratch ---> Step 2 : ADD so.tar.gz / ---> Using cache ---> 82b2b6def214 Step 3 : COPY redis.conf /etc/redis/redis.conf ---> 3f382da261be Removing intermediate container 60af6a5ab042 Step 4 : EXPOSE 6379 ---> Running in 78c541686668 ---> 043ed6cf87e0 Removing intermediate container 78c541686668 Step 5 : CMD redis-server ---> Running in 2c8b9fb0547d ---> 75d828ebf3aa Removing intermediate container 2c8b9fb0547d Successfully built 75d828ebf3aa
对比镜像大小:

从结果我们可以看出,精简效果非常显著,基于scratch构建的新镜像大小只有6.9MB,相比之前的359MB、228MB、102MB,新镜像空间占用已经很少。
结 语
以上即是本文精简Docker镜像的整个过程。
除了上面我们介绍的精简方法之外,还有一些常见的精简方式,如使用镜像压缩工具docker-squash,但此种方式压缩效果并不明显,因此在此我们并未做详细介绍,感兴趣的朋友也可以自己尝试噢。
推荐阅读
Rancher 2.2 GA:企业进入应用跨多K8S集群、混合云部署新时代
15分钟!在Azure上部署Rancher管理Kubernetes
如何零停机为混合云架构中的Kubernetes集群进行扩缩容
Refer: 如何快速将容器云镜像大小精简98%?
浙公网安备 33010602011771号