美文网首页运维nginxIT必备技能
Nginx 的两种限流方式

Nginx 的两种限流方式

作者: PENG先森_晓宇 | 来源:发表于2021-03-11 11:38 被阅读0次

    系统设计时一般会预估负载,当系统暴露在公网中时,恶意攻击或正常突发流量等都可能导致系统被压垮,而限流就是保护措施之一。限流即控制流量,本文将记录 Nginx 的二种限流设置。

    生活中的 “限流”?

    限流并非新鲜事,在生活中亦无处不在,下面例举一二:

    • 博物馆:限制每天参观总人数以保护文物
    • 高铁安检:有若干安检口,旅客依次排队,工作人员根据安检快慢决定是否放人进去。遇到节假日,可以增加安检口来提高处理能力(横向拓展),同时增加排队等待区长度(缓存待处理任务)。
    • 办理银行业务:所有人先领号,各窗口叫号处理。每个窗口处理速度根据客户具体业务而定,所有人排队等待叫号即可。若快下班时,告知客户明日再来(拒绝流量)。
    • 水坝泄洪:水坝可以通过闸门控制泄洪速度(控制处理速度)。

    以上”限流”例子,可以让服务提供者稳定的服务客户。

    限流算法

    常用的限流算法有漏桶算法和令牌桶算法。

    漏桶算法与令牌桶算法在表面看起来类似,很容易将两者混淆。但事实上,这两者具有截然不同的特性,且为不同的目的而使用。漏桶算法与令牌桶算法的区别在于:漏桶算法能够强行限制数据的处理速率。令牌桶算法能够在限制数据的处理速率的同时还允许某种程度的突发传输。因此,漏桶算法对于存在突发特性的流量来说缺乏效率。而令牌桶算法则能够满足这些具有突发特性的流量。通常,漏桶算法与令牌桶算法结合起来为网络流量提供更高效的控制。

    漏桶算法

    漏桶算法思路很简单,先设置一个固定容量大小的桶,水(请求)会先进入到漏桶里,漏桶以一定的速度出水,当水流入速度过大会直接溢出,直接流失这部分溢出的水,可以看出漏桶算法能强行限制数据的传输速率。

    漏桶的大小是固定的,处理速度也是固定的,但是请求的速率的不固定的。在突发的情况下,会直接拒绝很多请求。

    令牌桶算法

    令牌桶算法的原理是系统会以一个恒定的速度往桶里放入令牌,直到桶满为止,而如果请求需要被处理,则需要先从桶里获取一个令牌,当桶里没有令牌可取时,则拒绝请求。

    相比漏桶算法,令牌桶算法不同之处在于它不但有一只“桶”,还有个队列,这个桶是用来存放令牌的,队列才是用来存放突发请求的。

    漏桶和令牌桶算法最明显的区别就是是否允许突发流量(burst)的处理,漏桶算法能够强行限制数据的实时传输(处理)速率,对突发流量不做额外处理;而令牌桶算法能够在限制数据的平均传输速率的同时允许某种程度的突发请求,将突发请求存放到队列中,而不会像漏桶那样直接拒绝掉这部分请求。

    Nginx 限流

    Nginx 提供两种限流方式,一是控制速率,二是控制并发连接数。

    控制速率

    正常限流

    ngx_http_limit_req_module 模块提供限制请求处理速率能力,使用了漏桶算法(leaky bucket)。下面例子使用 nginx limit_req_zone 和 limit_req 两个指令,限制单个IP的请求处理速率。

    nginx.conf http 中添加限流配置:

    格式:limit_req_zone key zone rate

        http {
            limit_req_zone $binary_remote_addr zone=myRateLimit:10m rate=10r/s;
        }
    

    配置 server,使用 limit_req 指令应用限流。

    server {
        location / {
            limit_req zone=myRateLimit;
            proxy_pass http://my_upstream;
        }
    }
    
    • key :定义限流对象,binary_remote_addr 是一种key,表示基于 remote_addr(客户端IP) 来做限流,binary_ 的目的是压缩内存占用量。
    • zone:定义共享内存区来存储访问信息, myRateLimit:10m 表示一个大小为10M,名字为myRateLimit的内存区域,可以理解为桶的容量。1M能存储16000 IP地址的访问信息,10M可以存储16W IP地址访问信息。
    • rate 用于设置最大访问速率,rate=10r/s 表示每秒最多处理10个请求。Nginx 实际上以毫秒为粒度来跟踪请求信息,因此 10r/s 实际上是限制:每100毫秒处理一个请求。这意味着,自上一个请求处理完后,若后续100毫秒内又有请求到达,将拒绝处理该请求。

    处理突发流量

    上面例子限制 10r/s,如果有时正常流量突然增大,超出的请求将被拒绝,无法处理突发流量,可以结合 burst 参数使用来解决该问题。

    server {
        location / {
            limit_req zone=myRateLimit burst=20;
            proxy_pass http://my_upstream;
        }
    }
    

    burst 译为突发、爆发,表示在超过设定的处理速率后能额外处理的请求数。当 rate=10r/s 时,将1s拆成10份,即每100ms可处理1个请求。

    此处,burst=20,若同时有21个请求到达,Nginx 会处理第一个请求,剩余20个请求将放入队列,然后每隔100ms从队列中获取一个请求进行处理。若请求数大于21,将拒绝处理多余的请求,直接返回503,也就是说这个队列的大小为20,每隔100ms清空一次队列。

    不过,单独使用 burst 参数并不实用。假设 burst=50 ,rate依然为10r/s,排队中的50个请求虽然每100ms会处理一个,但第50个请求却需要等待 50 * 100ms即 5s,这么长的处理时间自然难以接受。

    因此,burst 往往结合 nodelay 一起使用。

    server {
        location / {
            limit_req zone=myRateLimit burst=20 nodelay;
            proxy_pass http://my_upstream;
        }
    }
    

    nodelay 针对的是 burst 参数,burst=20 nodelay 表示这20个请求立马处理,不能延迟,相当于特事特办。不过,即使这20个突发请求立马处理结束,在100ms之内后续来了请求也不会立马处理。burst=20 相当于缓存队列中占了20个坑,即使请求被处理了,这20个位置也只能按 100ms一个来释放。

    这就达到了速率稳定,但突然流量也能正常处理的效果。

    但是请注意,虽然设置burst和nodelay能够降低突发请求的处理时间,但是长期来看并不会提高吞吐量的上限,长期吞吐量的上限是由rate决定的,因为nodelay只能保证burst的请求被立即处理,但Nginx会限制队列元素释放的速度,就像是限制了令牌桶中令牌产生的速度。

    增加了burst参数之后就具有了令牌桶处理突发请求的能力了,但是limit_req_zone本质还是一个漏桶算法。

    定义response的http code

    limit_req_zone $binary_remote_addr zone=mylimit:10m rate=2r/s;
    server { 
        location / { 
            limit_req zone=mylimit burst=4 nodelay;
            limit_req_status 598;
        }
    }
    

    限制连接数

    ngx_http_limit_conn_module 提供了限制连接数的能力,利用 limit_conn_zonelimit_conn 两个指令即可。下面是 Nginx 官方例子:

        limit_conn_zone $binary_remote_addr zone=perip:10m;
        limit_conn_zone $server_name zone=perserver:10m;
        server {
            ...
            limit_conn perip 10;
            limit_conn perserver 100;
        }
    

    limit_conn perip 10 作用的key 是 $binary_remote_addr,表示限制单个IP同时最多能持有10个连接。

    limit_conn perserver 100 作用的key是 $server_name,表示虚拟主机(server) 同时能处理并发连接的总数。

    需要注意的是:只有当 request header 被后端server处理后,这个连接才进行计数。

    设置白名单

    限流主要针对外部访问,内网访问相对安全,可以不做限流,通过设置白名单即可。利用 Nginx ngx_http_geo_modulengx_http_map_module 两个工具模块即可搞定。

    nginx.confhttp 部分中配置白名单:

        geo $limit {
            default 1;
            10.0.0.0/8 0;
            192.168.0.0/24 0;
            172.20.0.35 0;
        }
        map $limit $limit_key {
            0 "";
            1 $binary_remote_addr;
        }
        limit_req_zone $limit_key zone=myRateLimit:10m rate=10r/s;
    

    geo 对于白名单(子网或IP都可以) 将返回0,其他IP将返回1。

    map 将 limit 转换为limit_key,如果是 $limit 是0(白名单),则返回空字符串;如果是1,则返回客户端实际IP。

    limit_req_zone 限流的key不再使用 binary_remote_addr,而是limit_key 来动态获取值。如果是白名单,limit_req_zone 的限流key则为空字符串,将不会限流;若不是白名单,将会对客户端真实IP进行限流。

    拓展阅读

    除限流外,ngx_http_core_module 还提供了限制数据传输速度的能力(即常说的下载速度)。

    例如:

    location /flv/ {
        flv;
        limit_rate_after 20m;
        limit_rate       100k;
    }
    

    这个限制是针对每个请求的,表示客户端下载前20M时不限速,后续限制100kb/s。

    参考连接
    https://toutiao.io/posts/r9wf3f/preview

    相关文章

      网友评论

        本文标题:Nginx 的两种限流方式

        本文链接:https://www.haomeiwen.com/subject/qhowqltx.html