18 Nginx中的缓存与压缩配置
1. Nginx中的缓存介绍
由于 Nginx 是在网站的所有其他后台服务的最前线,它接收的请求和流量是后台服务的数倍甚至数十倍之多。因此,用好 Nginx 的缓存功能对于大型网站而言至关重要。Nginx 中的缓存功能优势如下:
- 提升所有客户端体验
- 有效降低上游服务器的负载
- 减少上游服务器之间的流量消耗
Nginx 的 Web 缓存服务主要由 proxy_cache 相关指令集和 fastcgi_cache 相关指令集构成,前者用于反向代理时,对后端内容源服务器进行缓存,后者主要用于对 FastCGI 的动态程序进行缓存。两者的功能基本上一样。强大的缓存功能也成为了 Nginx 吸引众多用户的重要因素之一。
2. Nginx中缓存指令
2.1 expires指令
Nginx 中的 expires 指令通过控制 HTTP 相应中的" Expires" 和 "Cache-Control"的头部值,达到控制浏览器缓存时间的效果。指令格式如下:
Syntax: expires [modified] time;
expires epoch | max | off;
Default:
expires off;
Context: http, server, location, if in location
Nginx 中的时间单位有s(秒), m(分), h(小), d(天)。指令参数说明:
- epoch: 指定"Expires"的值为1, 即 January,1970,00:00:01 GMT;
- max: 指定"Expires"的值为31 December2037 23:59:59GMT, "Cache-Control"的值为10年;
- -1:指定"Expires"的值为当前服务器时间-1s,即永远过期;
off:不修改"Expires"和"Cache-Control"的值 - time中出现@表示具体的时间,比如@18h30m表示的是下午6点半;
官方的示例如下:
expires 24h; # 24小时过期
expires modified +24h;
expires @24h;
expires 0; # 不缓存,立即过期
expires -1; # 用不过期
expires epoch;
expires $expires;
2.2 proxy 模块中的 cache 相关指令
Nginx 的 proxy 模块中定义了许多和 cache 相关的模块,这是配置 http 请求代理的缓存功能。
通常情况下,我们使用 proxy_cache 指令开启 Nginx 缓存功能,用 proxy_cache_path 指令来设置缓存的路径和其他配置。两个指令的用法如下:
Syntax: proxy_cache zone | off;
Default: proxy_cache off;
Context: http, server, location
Syntax: proxy_cache_path path [levels=levels] [use_temp_path=on|off] keys_zone=name:size [inactive=time] [max_size=size] [manager_files=number] [manager_sleep=time] [manager_threshold=time] [loader_files=number] [loader_sleep=time] [loader_threshold=time] [purger=on|off] [purger_files=number] [purger_sleep=time] [purger_threshold=time];
Default: —
Context: http
proxy_cache_path 指令中有较多的参数,部分重要参数说明如下:
- path: 定义缓存存放的位置;
- levels: 定义缓存路径的目录等级,最多3级
- use_temp_path:
- on: 使用proxy_temp_path定义的目录
- off:
- keys_zone:
- name: 共享内存名
- size: 共享内存大小
- max_size: 设置最大的缓存文件大小
其余的重要的缓存指令有:
- proxy_cache_key: 配置缓存的关键字,格式如下:
Syntax: proxy_cache_key string;
Default: proxy_cache_key $scheme$proxy_host$request_uri;
Context: http, server, location
示例:
proxy_cache_key "$host$request_uri $cookie_user";
- proxy_cache_valid: 配置缓存什么样的响应,缓存多长时间。注意,如果只设置了缓存时间,只缓存只针对相应码200, 301和302的请求 。格式如下:
Syntax: proxy_cache_valid [code ...] time;
Default: —
Context: http, server, location
示例:
proxy_cache_valid 200 302 10m;
proxy_cache_valid 404 1m;
# 只设置了缓存时间,只对200,301和302有效
proxy_cache_valid 5m;
proxy_cache_valid 200 302 10m;
proxy_cache_valid 301 1h;
# any表示所有相应码
proxy_cache_valid any 1m;
- proxy_cache_methods: 对哪种 method 的请求使用缓存返回响应。
Syntax: proxy_cache_methods GET | HEAD | POST ...;
Default: proxy_cache_methods GET HEAD;
Context: http, server, location
3. Nginx中的压缩配置
Nginx 的压缩配置主要是用在与浏览交互中,对网页、css、js等静态资源进行压缩,通过消耗 cpu 的计算资源来节约大量的带宽,提高传输效率,给用户良好的体验。Nginx 中的 ngx_http_gzip_module 就是专门处理这里压缩功能的模块。其中部分重要指如下:
- gzip: 是否打开 gzip 压缩功能;
Syntax: gzip on | off;
Default: gzip off;
Context: http, server, location, if in location
- gzip_buffers: 设置压缩所需要的缓冲区大小;
Syntax: gzip_buffers number size;
Default: gzip_buffers 32 4k|16 8k;
Context: http, server, location
- gzip_comp_level: 设置压缩级别,从1-9;越大压缩率越高,同时消耗cpu资源也越多;
Syntax: gzip_comp_level level;
Default: gzip_comp_level 1;
Context: http, server, location
- gzip_types:需要压缩的文件格式 text/html默认会压缩,不用添加;
Syntax: gzip_types mime-type ...;
Default: gzip_types text/html;
Context: http, server, location
- gzip_min_length: 压缩文件最小大小;
Syntax: gzip_min_length length;
Default: gzip_min_length 20;
Context: http, server, location
一个常见的压缩配置如下:
# 开启gzip压缩
gzip on;
# http的协议版本
gzip_http_version 1.0;
# IE版本1-6不支持gzip压缩,关闭
gzip_disable 'MSIE[1-6].';
#需要压缩的文件格式
gzip_types text/css text/javascript application/javascript image/jpeg image/png image/gif;
#设置为4个8K内存作为压缩结果流缓存
gzip_buffers 4 8k;
#压缩文件最小大小
gzip_min_length 1k;
#压缩级别1-9
gzip_comp_level 9;
#给响应头加个vary,告知客户端能否缓存
gzip_vary on;
#反向代理时使用
gzip_proxied off;
注意: gzip 的开启需适应特定的场景,比如大文件和图片的传输就不是和开启 gzip 功能,压缩效果不明显的同时还白白耗费系统的资源,所以使用时需要慎重考虑。
4. 案例实战
4.1 expires 指令用法
首先准备 nginx.conf,中间简单配置几条 expires 指令用作测试:
...
http{
server {
listen 8000;
location / {
default_type text/plain;
expires 10m;
#expires -1h;
return 200 '8000, servern';
}
}
}
...
下面观察请求结果:
# 使用 expires 10m 配置,可以看到Expires值正好为10分钟后
[shen@shen ~]$ curl http://180.76.152.113:8000 -I
HTTP/1.1 200 OK
Server: nginx/1.17.6
Date: Thu, 06 Feb 2020 11:37:17 GMT
Content-Type: text/plain
Content-Length: 13
Connection: keep-alive
Expires: Thu, 06 Feb 2020 11:47:17 GMT
Cache-Control: max-age=600
# 使用 expires -1h 配置, -1h表示环境一个小时前过期了,所以返回Cache-Control的值为no-cache
[shen@shen ~]$ curl http://180.76.152.113:8000 -I
HTTP/1.1 200 OK
Server: nginx/1.17.6
Date: Thu, 06 Feb 2020 11:37:32 GMT
Content-Type: text/plain
Content-Length: 13
Connection: keep-alive
Expires: Thu, 06 Feb 2020 10:37:32 GMT
Cache-Control: no-cache
4.2 proxy_cache 缓存实验
准备好 proxy_cache 缓存相关的配置,如下:
...
http {
server {
listen 8000;
location / {
default_type text/plain;
return 200 '8000, servern';
}
}
server {
listen 8001;
location / {
default_type text/plain;
return 200 '8001, servern';
}
}
server {
listen 8002;
location / {
default_type text/plain;
return 200 '8002, servern';
}
}
# 定义上游服务器
upstream backends {
server 127.0.0.1:8000;
server 127.0.0.1:8001;
server 127.0.0.1:8002;
}
# proxy_cache_path 指令
proxy_cache_path /root/test/cache levels=1:2 keys_zone=nginx_cache:10m max_size=10g inactive=60m use_temp_path=off;
server {
listen 80;
location / {
proxy_pass http://backends;
proxy_cache nginx_cache;
# 状态码为200和301的缓存1分钟
proxy_cache_valid 200 301 1m;
# 其余的缓存10分钟
proxy_cache_valid any 10m;
# response响应的头信息中定义缓存的状态(有没有命中)
proxy_cache_key "$host$uri$is_args$args";
expires 1d;
proxy_no_cache $cookie_nocache $arg_nocache $arg_comment;
proxy_no_cache $http_pragma $http_authorization;
# add_header 响应添加缓冲命中结果
add_header Nginx-Cache "$upstream_cache_status";
}
}
...
我们通过 curl 命令向 Nginx 所在主机的 80端 请求,第一次请求转发到8000端口,结果被缓存; 第2-3次请求时由缓存返回结果,所以仍然是8000端口的返回;等待超过1分钟后,缓存失效,请求被转发到8001端口进行处理,返回相应结果;最后再次请求80端口,依旧由缓存命中,返回8001端口的响应结果。参看日志记录的 http 请求。
# 第一次请求,转到8000端口响应,然后缓存
[shen@shen ~]$ curl http://180.76.152.113
8000, server
# 接下来请求全部由缓存命中
[shen@shen ~]$ curl http://180.76.152.113
8000, server
[shen@shen ~]$ curl http://180.76.152.113
8000, server
[shen@shen ~]$ curl http://180.76.152.113
8000, server
# 缓存失效,转发到8001端口相应,并缓存结果
[shen@shen ~]$ curl http://180.76.152.113
8001, server
# 继续命中缓存
[shen@shen ~]$ curl http://180.76.152.113
8001, server
查看请求的响应结果:
[root@server sbin]# tail -f ../logs/access.log
127.0.0.1 - - [06/Feb/2020:20:14:15 +0800] "GET / HTTP/1.0" 200 13 "-" "curl/7.29.0" "-""-"
103.46.244.69 - - [06/Feb/2020:20:14:15 +0800] "GET / HTTP/1.1" 200 13 "-" "curl/7.29.0" "-""MISS"
103.46.244.69 - - [06/Feb/2020:20:14:23 +0800] "GET / HTTP/1.1" 200 13 "-" "curl/7.29.0" "-""HIT"
103.46.244.69 - - [06/Feb/2020:20:14:26 +0800] "GET / HTTP/1.1" 200 13 "-" "curl/7.29.0" "-""HIT"
127.0.0.1 - - [06/Feb/2020:20:16:10 +0800] "GET / HTTP/1.0" 200 13 "-" "curl/7.29.0" "-""-"
103.46.244.69 - - [06/Feb/2020:20:16:10 +0800] "GET / HTTP/1.1" 200 13 "-" "curl/7.29.0" "-""EXPIRED"
103.46.244.69 - - [06/Feb/2020:20:16:22 +0800] "GET / HTTP/1.1" 200 13 "-" "curl/7.29.0" "-""HIT"
5. 小结
本节内容主要是介绍 Nginx 中的缓存功能。一个是针对浏览器的缓存控制,另一个是针对上游服务器对 http 请求进行缓存,以减轻上游服务器的负载,这在高流量场景下是非常必要的。接下来,我们完成两个实验,测试前面讲到的缓存指令,并实际观察缓存效果。