容器环境持续集成优化，Drone CI 提速 500%

乐正焕

2023-12-01

前文介绍了容器环境下 Drone + semantic release 实现的语义化持续集成 Workflow，为了方便演示，流程仅给出了工作流中最重要的几个环节，实际用起来可能会发现不少值得优化的地方。

因此本次在这个工作流的基础上，介绍一些容器环境下 CI 的优化及提速方法，方法本身不限定一定要使用 Drone，使用同样的思路完全可以套用到其他的 CI 工具中。

优化前项目概况

以一个生产环境的实际项目为例，项目的主要结构如下

├── Dockerfile
├── dist/
├── node_modules/
├── package.json
└── src/
复制代码

这是一个比较常见的基于 React 的前端项目，用 npm list | wc -l 可以看到有 3952 个依赖，项目会通过 webpack 打包到 dist目录下，打包命令被封装成 npm run build。最终 dist 目录通过 Dockerfile 被打包到 Nginx 的 Docker 镜像内，生产环境直接运行打包后的镜像即可。

Dockerfile 是这样编写的

FROM node:10 as build  
WORKDIR /app  
COPY . /app  
RUN npm install  
RUN npm run build  

FROM nginx:1.15-alpine  
COPY --from=build /app/dist /usr/share/nginx/html  
复制代码

使用了 Docker 的多阶段构建功能，即 npm 的安装，编译作为第 1 个阶段，编译完成后仅将编译的结果 dist 文件夹复制出来，其余未复制的文件丢弃，这样打包后的镜像仅为 23.2MB，更利于部署。

流程瓶颈分析

发布流程直接套用前文介绍的 Gitflow + semantic release 工作流。可以看到此时的一次发布是比较慢的，push 到 master 构建 staging 镜像用时 9:18，semantic release 打上 Tag 构建 production 镜像用时 6:24。

这个过程中到底慢在哪里呢，在 Drone 的构建过程中看到，容器构建的耗时占了 90%以上，一方面 npm 需要下载安装 3000 多个依赖，另一方面 webpack 的编译也需要 30s 左右，如果网络再有不稳定，等待时间无疑会更长。

另一个耗时的元凶也很明显，由于引入了 semantic release， push master 和 release 两个动作会触发 2 次 CI，每次 CI 都进行了 Docker 镜像的构建，但其实如果没有异常发生，两个 Docker 镜像对应的其实是同一份代码，应当是完全一致的，即 release 时的镜像构建所花费的时间是浪费的。

其他当然还有应用层面的优化，比如可以用 yarn 替代 npm，使用更快的源，去除不必要的依赖等等，但这些并不在本文的讨论范围内，就略过不提。

引入缓存减少重复下载

每次构建都要下载 3000 多个依赖，那么最容易想到的当然是将这些依赖缓存起来，但是在这个项目中，npm 下载/编译都发生在容器构建环节，这是比较难引入缓存的。因此首先要做的，是将下载/编译过程从容器转移到 CI，通过 CI 完成下载/编译，再将结果复制到容器镜像内。

在下载/编译转移到 CI 的基础上，可以直接使用 Drone 提供的缓存插件，目前根据不同文件系统，Drone 可选的缓存插件有

这里以 Volume Cache 为例，.drone.yml如下。这里的语法对应 Drone-v1.0 以上版本，可能与官方部分旧文档有出入。

steps:
- name: restore-cache  
  image: drillster/drone-volume-cache  
  settings:  
    restore: true  
    mount:  
      - ./.npm-cache  
      - ./node_modules  
  volumes:  
    - name: cache  
      path: /cache   

- name: npm-install  
  image: node:10  
  commands: 
    - npm config set cache ./.npm-cache --global  
    - npm install  
 
- name: build-dist  
  image: node:10  
  commands:  
    - npm run build

- name: rebuild-cache  
  image: drillster/drone-volume-cache  
  settings:  
    rebuild: true  
    mount:  
      - ./.npm-cache  
      - ./node_modules  
  volumes:  
    - name: cache  
      path: /cache

volumes:  
  - name: cache  
    host:  
      path: /tmp/cache
复制代码

Volume Cache 插件使用很简单，首先需要声明一个 Volume，对应主机的一个文件夹，这里使用的是/tmp/cache。Volume Cache 插件的参数中，mount 列出需要缓存的文件夹，restore: true会将文件从主机复制到容器，因此放在 pipeline 的开头，rebuild: true则反之，放在 pipeline 最后。

另外注意使用 Volume 需要在 Drone 中将 Repo 设置为 Trusted。

而此时的 Dockerfile 就只剩下文件复制的部分了

FROM nginx:1.15-alpine  
COPY ./dist /usr/share/nginx/html  
复制代码

在增加了缓存后，构建的时长大幅下降到 2:38，整体耗时下降了 50%以上。

通过 Docker Tag 省略重复的构建

在上文的基础上，不难想到 push master 和 release 造成的重复构建，是否也可以同样通过缓存去除。这当然在理论上也是可行的，但是由于缓存并不稳定，因此需要更为通用的方法。

在 semantic release 的流程中，push master 和 release 的唯一区别就是 release 增加了一个 git tag。而 git tag 本质上只是对一个特定 commit 的引用，并不会改变 commit 记录，因此 push master 和 release 两次触发的 CI 中，最后一次 commit 是相同的，即 DRONE_COMMIT_SHA 不会改变。

基于这一点，我们可以在 push master 的构建中，将DRONE_COMMIT_SHA作为 Docker 镜像额外的 Tag，在 release 环节，只要给有 DRONE_COMMIT_SHA Tag 的镜像再打上最终的版本号 Tag 即可，并不需要在 release 环节从头构建镜像。

这个过程对应 .drone.yml 如下

  - name: push-docker-staging  
    image: plugins/docker  
    settings:  
      repo: allovince/xxx
      username: allovince  
      password: 
        from_secret: DOCKER_PASSWORD  
      tag:  
        - staging  
        - sha_${DRONE_COMMIT_SHA} 
    when:  
      branch: master  
      event: push  
  
  - name: semantic-release  
    image: gtramontina/semantic-release:15.13.3  
    environment:  
      GITHUB_TOKEN:  
        from_secret: GITHUB_TOKEN  
    entrypoint:  
      - semantic-release  
    when:  
      branch: master  
      event: push  
  
  - name: push-docker-production  
    image: plugins/docker  
    environment:  
      DOCKER_PASSWORD:  
        from_secret: DOCKER_PASSWORD  
    commands:   
      - docker -v  
      - nohup dockerd &  
      - docker login -u allovince -p $${DOCKER_PASSWORD}  
      - docker pull allovince/xxx:sha_$${DRONE_COMMIT_SHA}  
      - docker tag allovince/xxx:sha_$${DRONE_COMMIT_SHA} allovince/xxx:$${DRONE_TAG}  
      - docker push allovince/xxx:$${DRONE_TAG}  
    when:  
      event: tag  
    privileged: true
复制代码

假设最后一次 commit 的 hash 是 c0558777， release 版本是 v1.0.9， push master 后，镜像将打上

staging
sha_c0558777

两个 Tag，在 release 后，镜像将再增加一个 v1.0.9的 Tag。

需要注意的是为镜像打 Tag 使用到了 Docker-in-Docker，需要 privileged flag，即privileged: true

同时 docker tag 等命令依赖 docker daemon 的启动，否则会报错

Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the docker daemon running?

一种方式是挂载主机的 daemon /var/run/docker.sock，另一种方式是在容器内启动 docker daemon，我这里使用的是后者，对应 nohup dockerd &，而在 release 阶段，由于任务仅仅是为 docker 镜像额外增加一个 tag，以及通知生产环境发布，因此上文中的 cache 等环节都可以通过条件省略，结果如下。

如此优化后 release 环节的耗时缩短到 1 分钟以内，看看最终成果，从代码提交到发布完成，总耗时不到 5 分钟，是比较友好的。

容器环境持续集成优化，Drone CI 提速 500%

优化前项目概况

流程瓶颈分析

引入缓存减少重复下载

通过 Docker Tag 省略重复的构建

相关阅读

相关文章

相关问答

相关文档