|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
8 N, a. {# w/ \/ a' ]! Q
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑
2 ~! t. Q2 q& B7 M: f8 P从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。
4 k3 ^' c; [5 h4 _ N& d: v
9 a) N2 u- {2 f. X. E那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效); v, V, |0 P2 K; U
6 h/ H8 _0 v, w/ s" M; j2 n' B4 o5 i) h
- worker_processes 1;
! J8 K" r/ g" b; o/ F5 `2 s - events{
复制代码 ' d" ^$ e, z2 r
: d" n0 D/ G: o2 F! m) \/ f) g9 O重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方
2 w* I; O" ~7 [, j; U, t. i2 \. G0 b$ U" o2 b
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。 h/ a" z" e- p4 m- N9 z( }. F
! j/ k1 q+ C; I
- v$ j1 G" Z. T! w6 O接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?
$ f/ x1 j$ o6 d& W4 j$ q8 E1 E' w( ^2 G9 y: Z
$ {( R" m- Y, p/ i9 O7 }9 M+ t# c
4 v/ F1 L! M1 J( r G8 Q
# ~1 s W W( N/ K
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: % `. `' ~5 C: v3 [2 d! t5 X% r& w
" z s- U% `& N, i7 r3 C! Z$ h* U+ Y4 k) q3 V
这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
. i( c: b- i+ s. l- Y' g 2. 加权轮询,使用weight参数设置,配置如下
( \) V2 G, c1 e& Y8 c6 V
$ B$ l% M7 y0 Q d
3. ip_hash策略& V7 c) ^: P3 j2 X4 K% ?7 M
(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
5 F4 a& f4 B$ Z* b# y: C8 { 其他地方保持不变,在upstreaem中如下设置:' U/ ^& D5 P2 t4 E
* ?" v9 a+ z6 t8 S& @; M
+ n/ A/ I$ R$ ]
( B8 r# \! o% x0 \
& G" Q- R1 e8 U4. fair策略
% A; k* a6 k, l1 |4 z' \(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
% }4 h9 k/ @9 G. p5. url_hash策略/ n. ~. N5 r* D6 R3 p8 Y
1 D: U# g c) i( V
(类似于ip,只不过绑定的值是url,这个也是第三方策略)/ O0 \0 p8 d2 z0 W3 a* r; W* g- p
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可: L% c2 D$ T# i; x' s, s
9 n" J+ q6 U4 H: x! g! V) D
( d0 \1 I5 d0 S. H! P& q1 W$ d9 ^% q( [5 t
url_hash策略的用处?7 A$ ~+ r, E, z+ F. K
% {6 F: P; j6 q" {3 K- A' a
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。% ^2 @! a- a8 M( C+ o& v
3 o, X/ ^) k( Y \. W5 \5 g7 k$ [原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;# D. O4 z6 |2 V3 k
; f1 i. N1 g. J9 \
0 G& K2 w& o6 x0 C G
: ?% |; D) x6 m$ e+ Z+ r其他的配置
) S, V+ `$ f8 z3 ?9 j s备份与停机状态:" X$ E$ Q3 i+ `! z+ G4 K9 T
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
9 L9 J. |. T5 A" A8 |1 U
4 l6 I# }! G1 [server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,+ g$ Y0 h, X0 f# H- z- M
) s0 s7 R" O9 r& X
down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。
- k0 C# Q( ~/ J
% Q" l' C) q* H
. t! ~6 l m! D# R% w' a8 j Y0 N: e/ f7 A* M
max_fails: 达到指定次数后认为服务器挂掉( a& Q7 r* o2 P, k4 f
" W3 A5 \% R6 g9 _" I3 @+ P+ v
fail_timeout:挂掉多久后再次测试是否已经挂掉
2 i" M2 }2 d- | N% Q% _# {
: h+ \ e5 c1 w( K1 p7 @* \配置命令
' l, \7 K# d9 f4 G" E
9 k0 g6 ]. E- Vserver 192.168.1.66 max_fails=2 fail_timeout=60s;
) R) _; `% W( f$ A8 R. b# u( U! _) V$ B9 s9 ^
后记
% r8 O5 x8 b/ |; M9 Z我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
# W3 W+ D: K6 R9 R4 {: \: ^ l5 B8 @* H0 B# y u, d0 K
+ `5 J% B j* F7 f! G
7 o$ ^! h, D) O
& ^" z, v- n8 K/ h7 A3 A3 D
; l2 e0 F# Z& B! {$ T$ m
|