Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
# }2 b6 x7 e; W- j5 @
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ / f4 S5 S; ~8 w3 O# Y3 V$ D
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。
- s+ c4 [: r" T9 }. }5 o: Q
! L: x% M- A. |# ^; t那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效), v4 [/ y/ S4 j3 @, Q- y/ b
6 G* w- K1 t# A3 d9 j1 c( J8 G8 ~; i `2 \# m- q# ^0 [
- worker_processes 1;
& c8 X, M% y' y! _- w - events{
复制代码
7 F: a7 f# C% J/ a$ V+ W
; L& e, ~; `; n F重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方# O. h/ e6 |) ^. j
, z& x4 V/ I1 Z; ]! L: f! Z2 U比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。
5 f6 S8 ?- U) u; C( U I3 l$ _
! ]- G$ J% L8 t# t0 h/ i+ f" f0 J' ]' \( c
接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?
s+ w# ]. M( {( ?* `
# R0 E9 K. I* Y4 i8 @
! i) g# G: z9 E6 G& E- ]
2 a$ t8 Y6 `( s2 @5 }' b L7 [
5 H8 s0 y2 T; i- ]" `! J2 f
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: ) z3 ~; F6 {* G$ A3 N) h9 X0 B3 z
9 F( Z- x0 E7 ^, t$ e- q k
3 ]2 K: Q4 k$ N% _& F6 e9 R这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
& K3 j% _8 o' P# d& {0 N7 N, p7 B 2. 加权轮询,使用weight参数设置,配置如下
4 y1 C6 C+ m, f
( x! K4 p, C' A" }
3. ip_hash策略& F" T+ A' s: w( y8 i, P& F
(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
, N. b7 x$ P' P$ D1 F3 \ 其他地方保持不变,在upstreaem中如下设置:
; ?0 {7 r, J6 ^) Q/ c1 e# K% \0 n/ J
- m1 k/ k7 I3 C
. @$ t) P9 Y* b3 }" z
* I+ }' _6 U' K- a% F
4. fair策略
* r5 m. E6 }# p) ?1 ^/ o) x+ L(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
3 a" _: J5 H: W0 m3 P5. url_hash策略' f1 m9 J1 O2 P; l7 P
1 i) v0 v+ Q0 _: i$ _(类似于ip,只不过绑定的值是url,这个也是第三方策略)
; h& u* C7 B1 V' yfair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可2 M6 A7 M$ x: r6 h- h% }
9 V0 t" j7 f# w/ P; K9 A/ l
5 Z8 _9 I, x5 |; f( M
0 o- f% i) ^" K* W
url_hash策略的用处?
- E1 H! l/ j1 y( b; z" R4 Q+ A& ^1 W- m; m
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。
3 o& O" ~8 H. Y8 e7 C! T6 @% D
) ?+ r3 a' c7 [* }) z3 L0 F原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;
2 b7 ]6 B7 m/ X( M) d9 c. ~) J
# v9 B/ R* T8 U' a3 ?. C5 e4 N( ^/ Z: V: s; \0 @+ r }, V2 o
# d" [/ o9 a" g- n5 H
其他的配置4 X4 \% R- h! m+ j4 k( d
备份与停机状态:
9 k, |$ O- A: Qserver 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;9 D" ?2 m4 p: T. U% V
9 b4 @/ [" s: X7 @, h5 p0 e
server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,( a7 |6 U. `, ^! f
: u/ n' Q+ U: f$ w9 Idown存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。3 ?' b" V3 T$ K6 E
8 v7 F4 j- N1 q# K/ B
" D7 \4 N; L& i, n: Q
" _, B0 B& M; t T6 z7 \: l8 v
max_fails: 达到指定次数后认为服务器挂掉
! k& E0 l5 l7 |% X( t5 c/ Q( U4 ?: L' L& E' C0 _8 m
fail_timeout:挂掉多久后再次测试是否已经挂掉
3 P4 S3 o! G, Z6 }
: r5 [# X0 V# `% k: s M5 m* N配置命令7 [2 N4 l F( R7 ?$ D* k$ L1 S
/ v- g4 ]1 l# S0 w. ?server 192.168.1.66 max_fails=2 fail_timeout=60s;
4 P1 W# B1 b1 s) ]7 n6 V$ w7 @, L: p7 ~8 m( A1 a
后记3 y" m% |' m# e7 S$ {+ I
我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
K7 ~8 h0 m1 ~+ G* n/ |& ]# O# c L1 B1 X) |! W
: j D, z# ~3 n* I4 K9 p
/ F4 B3 j: D1 Q- f- x" y, \
6 R( z3 @; Y T( v
1 }4 f6 K5 ]5 X7 D. y |