聊聊 Docker 镜像
本文分享自天翼云开发者社区 @ 《 聊聊Docker镜像》,作者: AE86 上山了。
前言
回顾前面:
为什么需要 Docker?
Docker 入门为什么可以这么简单?
在上篇也同样留下一个问题:我们知道 Tomcat 运行起来需要 Java 的支持,那么我们在 DockerHub 拉取下来的 Tomcat 镜像是不是也有 Java 环境呢?
所以,这篇主要来讲讲 Docker 镜像相关的知识点!
一、简单了解 Dockerfile
Dockerfile 是用来构建 Docker 镜像的文件,是由一系列命令和参数构成的脚本。
简单来说:Dockerfile 是镜像的源码。
上一篇我们 pull 了一份 Tomcat 的镜像,我们也可以去看看它的 Dockerfile 长的什么样:
我们随便点进去一个看一下:
我们在 Dockerfile 的第一行就可以发现 FROM openjdk:8-jre,所以可以确定的是:在 DockerHub 拉取下来的 Tomcat 镜像一定有 Java 环境!
在这里我们先不说如何阅读/编写 Dockerfile 文件,先了解到 Dockerfile 是镜像的源码即可
简单来说:通过 Dockerfile 文件可以知道我们拉取下来的镜像究竟是怎么构建的。
二、解除镜像的疑惑
我们知道 Docker Hub 有很多常用的镜像,比如说 Centos。我们去 pull 一个下来看看 Docker 中的 Centos 长啥样:
我们可以发现的是:Tomcat 的 SIZE 竟然比 Centos 还要大!但按我们常规的想法,Centos 的镜像可能是 3 或 4GB(现在 200M),Tomcat 的镜像可能就 200M(现在 400M)。这是为什么呢??
如果我们在 pull 的时候观察得比较仔细的话,可以发现 pull 会拉下很多层镜像:
完全 pull 下来的之后,我们如果使用 docker images 只能查看到最终的镜像:
如果我们使用 docker images -a 命令的话,可以把中间层镜像都查出来:
理想效果:(在镜像列表里边除了 tomcat 和 centos 应该还夹杂着名为的镜像)
遗憾的是:博主一直没测出效果来,也就是我的镜像列表里没有的镜像(怀疑是版本的问题,我的版本是 Docker 版本是 18.09.1,Centos 的版本是 CentOS Linux release 7.3.1611 。如果知道具体原因的不妨在评论区下告诉我)
Emmm,我们可以使用 history 命令来看看,可以发现 Tomcat 包含很多个镜像层
还可以发现一点:Dockerfile 有多少条命令,那就有多少个镜像层(不信你数数)
说了那么多,就想让大家知道:我们拉取下来的镜像实际上是由很多中间层镜像组成的。
再结合我们上一篇 Docker 入门为什么可以这么简单?,在解决 Tomcat 启动时一直卡住问题时,能够发现的是,我们可以使用 cd, ls 等基础命令,但无法使用 vi 命令(需要我自己去下载)。
我们可以推断出,pull 下来的镜像由很多层镜像组成【这些镜像都是精简过的(甚至连 vi 命令都不支持)】
因为 Tomcat 镜像要的基础环境比 Centos 镜像要多,所以 Tomcat 镜像的 SIZE 比 Centos 要大
三、Docker 镜像的特点
关于 Docker 镜像,有以下特点:
由 Dockerfile 生成
呈现层级结构
每层镜像包含:镜像文件以及镜像 json 元数据信息
3.1 镜像呈现层级结构
联合文件系统(UnionFS)是实现 Docker 镜像的技术基础。在 Docker 中一般使用是 AUFS(Another Union File System 或 Advanced Multilayered Unification File System)【具体还是得看宿主机用的什么系统】。
在搜索中文资料的时候,常常会发现有类似的解释:
“AUFS 是一种 Union FS, 简单来说就是“支持将不同目录挂载到同一个虚拟文件系统下的文件系统”, AUFS 支持为每一个成员目录设定只读(Rreadonly)、读写(Readwrite)和写(Whiteout-able)权限。Union FS 可以将一个 Readonly 的 Branch 和一个 Writeable 的 Branch 联合在一起挂载在同一个文件系统下”。
看得我一头雾水….后来去官方文档介绍 AUFS:
AUFS is a union filesystem, which means that it layers multiple directories on a single Linux host and presents them as a single directory. These directories are called branches in AUFS terminology, and layers in Docker terminology
说白了,还是可以理解成:Docker 的镜像的基础是联合文件系统,它支持将文件系统中的修改信息作为一次提交,并层层叠加,外界看到的是最外层的镜像。(比如外界只看到 Tomcat 镜像,而中间叠加了很多层镜像)
(这里只是拿 AUFS 说明,Docker 实际上支持很多存储驱动,比如还有 devicemapper,overlay2(Ubuntu 的 14.04.4 或更高版本,16.04 或更高版本), overlay,zfs
3.1.1 镜像继承(共享)
Docker 镜像可以通过分层来进行继承。
例如,hello-world 的 Dockerfile 镜像 FROM scratch 镜像,scratch 在 Docker 中是一个基础镜像
FROM scratchCOPY hello /CMD ["/hello"]
Centos 的 Dockerfile 镜像也是 FROM scratch 镜像:
FROM scratchADD centos-7-docker.tar.xz /LABEL org.label-schema.schema-version="1.0" \ org.label-schema.name="CentOS Base Image" \ org.label-schema.vendor="CentOS" \ org.label-schema.license="GPLv2" \ org.label-schema.build-date="20181205"CMD ["/bin/bash"]
那么 Centos 镜像和 hello-world 共享同一个基础镜像层 scratch,提高了存储效率。
再说个例子,比如我们有一个 Centos 镜像,这个镜像大小是 202M。然后,我们基于 Centos 镜像手动往里边添加一个 Tomcat(假设这个 Tomcat 的大小是 300M),生成一个镜像,总大小就是 502M 了。
如果仅仅是单纯的累加这两个镜像的大小:202M+502M=704M,但是由于镜像复用的存在,实际占用的磁盘空间大小是:202M+300M=502M
AUFS uses the Copy-on-Write (CoW) strategy to maximize storage efficiency and minimize overhead。
如果想要了解 COW,不妨阅读我之前写过的文章:
COW 奶牛!Copy On Write 机制了解一下
CopyOnWriteArrayList 你都不知道,怎么拿 offer?
3.2json 文件
Docker 每一层镜像的 json 文件,都扮演着一个非常重要的角色,其主要的作用如下:
记录 Docker 镜像中与容器动态信息相关的内容
记录父子 Docker 镜像之间真实的差异关系
弥补 Docker 镜像内容的完整性与动态内容的缺失
Docker 镜像的 json 文件可以认为是镜像的元数据信息
版权声明: 本文为 InfoQ 作者【天翼云开发者社区】的原创文章。
原文链接:【http://xie.infoq.cn/article/ff723827f7364be82844943bd】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论