nginx负载均衡服务器配置

多个应用实例之间的负载均衡是一种优化资源常用的技术。是一种使流量最大化,降低延迟、容错的配置。
nginx可以作为一个高效的HTTP负载均衡服务器,用于将多个应用服务器的流量进行分配以提高性能扩展性及可靠性。

负载均衡的方法
下面的负载均衡机制(或方式)被nginx所支持:

  • 轮询:请求以轮询的形式传给应用服务器
  • 最少连接:下一个请求会分配给活跃连接数最少的服务器
  • ip哈希表:使用哈希函数决定下一个请求由哪个服务器处理(基于客户端的IP)

默认负载均衡服务器配置
最简单的负载均衡服务器的配置如下:

http {
    upstream myapp1 {
        server srv1.example.com;
        server srv2.example.com;
        server srv3.example.com;
    }

    server {
        listen 80;

        location / {
            proxy_pass http://myapp1;
        }
    }
}

在上面的例子中,有三个同样的应用实例在srv1-srv3上。当负载均衡的方法没有指定,默认是用轮询的方法。所有请求都会代理到服务器组myapp1上,nginx应用HTTP负载均衡分配请求。
nginx实现的反向代理包括HTTP、HTTPS、FastCGI、uwsgi、SCGI和memcached.
配置HTTPS的负载均衡,用https作为协议。
配置FastCGI、uwsgi、SCGI或memcached,分别使用fastcgi_pass, uwsgi_pass, scgi_pass, 和memcached_pass指令。
最少连接负载均衡
另一种负载均衡的规则是最少连接。最少连接规则允许使用更公平的方式控制负载,特别对于一些耗时较长的请求。
当least_conn指令用在服务器组配置中时,nginx会启用最少连接负载均衡:

upstream myapp1 {
    least_conn;
    server srv1.example.com;
    server srv2.example.com;
    server srv3.example.com;
}

会话持久化
请注意,轮询法和最小连接法负载均衡,所有随后的客户端请求可能会被分配到不同的服务器上。不能保证每个客户端的请求总是转发到同一个服务器。
如果有需要将一个客户端与特定的应用服务器进行绑定,换句话说,使客户端会话固定或持久化,可以使用ip-hash机制负载均衡。
使用ip-hash机制,客户端IP用作哈希关键词来决定使用哪个服务器组处理请求。这个方式确保了相同的客户端的请求总是转发到相同的服务器除非服务器不可用。
配置ip-hash负载均衡,只需要加上ip_hash指令到服务器组:

upstream myapp1 {
    ip_hash;
    server srv1.example.com;
    server srv2.example.com;
    server srv3.example.com;
}

带权重的负载均衡
可以通过服务器权重来进一步的影响nginx的负载均衡算法。
上面的例子中,没有配置服务器的权重,这意味着所有服务器的权重都是相同的。
在轮询方式中,权重意味着更多或更少的请求分配到服务器上。
当weight参数在一个server后定义了,权重会作为负载均衡的考量因素。

upstream myapp1 {
    server srv1.example.com weight=3;
    server srv2.example.com;
    server srv3.example.com;
}

在这个配置下,每5个新的请求会在应用实例中如下分配:3个请求转发到srv1,一个请求转发到srv2,另一个转发到srv3.
在最近的nginx版本中可以用类似的方法配置最少连接及ip-hash负载均衡的权重。
健康监测
nginx实现的反向代理包括同频带信号传输(或被动)服务器健康监测。如果一个服务器返回了错误,nginx将会标记这个服务器为失败。然后会在一段时间内避免向这个服务器转发请求。
max_fails指令设置了在fail_timeout期间与服务器之间进行的不成功的通信次数。默认情况下,max_fails为1。当设为0时,此服务器的健康检查被关闭。fail_timeout参数定义了多长时间服务器会被标记为失败的。在fail_timeout间隔结束后,nginx会开始优雅的通过客户端请求探测服务器。如果探测成功,服务器会被标记为可用。