什么是负载均衡

当一台服务器的单位时间内的访问量越大时，服务器压力就越大，大到超过自身承受能力时，服务器就会崩溃。为了避免服务器崩溃，让用户有更好的体验，我们通过负载均衡的方式来分担服务器压力。

我们可以建立很多很多服务器，组成一个服务器集群，当用户访问网站时，先访问一个中间服务器，在让这个中间服务器在服务器集群中选择一个压力较小的服务器，然后将该访问请求引入该服务器。如此以来，用户的每次访问，都会保证服务器集群中的每个服务器压力趋于平衡，分担了服务器压力，避免了服务器崩溃的情况。

负载均衡策略

图1.png

负载均衡参数

图2.png

1.轮询策略

最基本的配置方法，它是upstream模块默认的负载均衡默认策略。每个请求会按时间顺序逐一分配到不同的后端服务器。

upstream tomcat_server{
    server localhost:8080;
    server localhost:8081;
}
server {
    listen       8001;
    server_name localhost;
    location / {
        proxy_pass http://tomcat_server;
    }
}

注意：
在轮询中，如果服务器down掉了，会自动剔除该服务器。
缺省配置就是轮询策略。
此策略适合服务器配置相当，无状态且短平快的服务使用。

2.weight权重策略

#动态服务器组
upstream tomcat_server{
    server localhost:8080  weight=2;
    server localhost:8081;
    server localhost:8082  backup; 
    server localhost:8083  max_fails=2 fail_timeout=10s; 
}

weight参数用于指定轮询几率，weight的默认值为1。
权重越高，在被访问的概率越大，如上例 weight=2 ，访问几率为20%，其他为10%

注意：
权重越高分配到需要处理的请求越多。
此策略可以与least_conn和ip_hash结合使用。
此策略比较适合服务器的硬件配置差别比较大的情况。

3.ip_hash

指定负载均衡器按照基于客户端IP的分配方式，这个方法确保了相同的客户端的请求一直发送到相同的服务器，以保证session会话。这样每个访客都固定访问一个后端服务器，可以解决session不能跨服务器的问题。

#动态服务器组
upstream tomcat_server{
    ip_hash;  #保证每个访客固定访问一个后端服务器
    server localhost:8080  weight=2; 
    server localhost:8081; 
    server localhost:8082;
    server localhost:8083  max_fails=2 fail_timeout=10s; 
 }

注意：
在nginx版本1.3.1之前，不能在ip_hash中使用权重（weight）。
ip_hash不能与backup同时使用。
此策略适合有状态服务，比如session。
当有服务器需要剔除，必须手动down掉。

4.least_conn

把请求转发给连接数较少的后端服务器。轮询算法是把请求平均的转发给各个后端，使它们的负载大致相同；但是，有些请求占用的时间很长，会导致其所在的后端负载较高。这种情况下，least_conn这种方式就可以达到更好的负载均衡效果。

#动态服务器组
upstream tomcat_server{
  least_conn;  #把请求转发给连接数较少的后端服务器
  server localhost:8080  weight=2; 
  server localhost:8081;
  server localhost:8082 backup; 
  server localhost:8083  max_fails=2 fail_timeout=10s;
}

注意：
此负载均衡策略适合请求处理时间长短不一造成服务器过载的情况。

5.fail url_hash

第三方的负载均衡策略的实现需要安装第三方插件。
①fair

按照服务器端的响应时间来分配请求，响应时间短的优先分配。

#动态服务器组
upstream tomcat_server{
      server localhost:8080; 
      server localhost:8081; 
      server localhost:8082; 
      server localhost:8083; 
      fair;  #实现响应时间短的优先分配
}

②url_hash

按访问url的hash结果来分配请求，使每个url定向到同一个后端服务器，要配合缓存命中来使用。同一个资源多次请求，可能会到达不同的服务器上，导致不必要的多次下载，缓存命中率不高，以及一些资源时间的浪费。而使用url_hash，可以使得同一个url（也就是同一个资源请求）会到达同一台服务器，一旦缓存了资源，再次收到请求，就可以从缓存中读取。

#动态服务器组
upstream tomcat_server{
    hash $request_uri;  #实现每个url定向到同一个后端服务器
    server localhost:8080;
    server localhost:8081; 
    server localhost:8082; 
    server localhost:8083; 
}