|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示, % j6 ~! ]" |( G% e/ k; O( e
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ , [: x' ~1 B8 z2 }) L6 ^, T/ U. K
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。, F& i3 G. P) d& L
5 O2 [; q$ w# ]1 _$ ` I, H& L那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)
4 b8 ^8 U5 A# W* V
; Q. Q# h3 {6 Q' c5 j z" G6 p& j' c. s, I* V: V
- worker_processes 1;
, Z2 Y. @2 U+ D) | - events{
复制代码 " H- E! i; ~9 j! [6 w
* |8 m0 s! i8 z5 G& `0 Z4 q2 l
重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方
% r7 j; k+ x1 U
1 {, s6 m4 G, D0 d" D比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。
9 Z2 M; k7 X h
7 t8 X; o3 h) S4 |0 w7 e9 _6 ], u! U+ E% Z8 L: Z
接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?
7 Y% u7 j& E0 p T. z, E( y
) [# G/ p( o* J( X& K. I- a" K# I* i A" {! j) @" D5 n
. \& y( F3 \ J8 }* C
/ @( _# t4 O `# O; q负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: 7 f- c4 U: D, n. O
7 g7 s% R4 r$ H& O
0 }3 z5 u4 L9 B$ o/ F) n5 I这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。6 L1 e: c1 w- w8 Q- n6 T0 f: p( x7 f
2. 加权轮询,使用weight参数设置,配置如下7 O- x0 P& y# I9 T: V2 q p
6 L3 x, k& X+ Q; Y! c
3. ip_hash策略
& v9 b0 v$ r$ c: Y* C9 p(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
& W# r& f; ?* q. e& | 其他地方保持不变,在upstreaem中如下设置:
* P% x5 ]; N$ [3 O! ?; F! j+ W" n% [, y$ p
) t% h# m% T$ ]' ~+ B/ y5 _3 C
B" ^' {2 `* q4 c. B9 f
( p9 L+ m/ a' s+ e- _7 K4. fair策略& F" K! k5 N7 |
(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
0 |& I- G) _ C; D! D" a N5. url_hash策略
8 U J% M' ~, t3 {+ U9 Z! O0 B
9 z3 g' Y# s [2 l7 U% y/ b, K2 N(类似于ip,只不过绑定的值是url,这个也是第三方策略)
$ U j' O. K$ b1 o" j. hfair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可8 h; h; R2 B% M
/ O$ d- ^; e) m1 V
- w. O+ m9 c d- m
& Z! Z" `5 i: Z3 hurl_hash策略的用处?( T M5 C8 ^$ W( p: l) N; n- U$ L% _
6 _3 t8 \) Q/ L/ Z! a
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。0 s: ?- i/ v$ ^* u8 I
( C/ X( J- L4 |' Y! h0 F) ]- p* k
原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;
0 j6 h, Z& ?9 O" j
& m" G$ R8 u2 f- R" d& o
, d4 D$ Z( g6 h$ r5 U$ j, ?% b
3 K5 g2 v" L# C/ |, s其他的配置
9 A8 ~0 {6 l( O; R: l备份与停机状态:& D; l0 H! X) z! B1 U. Q5 D: m
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;$ y4 _0 k0 @( B( z1 W
# I- q: }# ~- Rserver 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,% A& p" W+ F' @5 O( q' H
4 ?- M* w" p% ~$ j, h" r/ F
down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。0 W' L0 O3 _7 E1 P7 @' A
* x$ H C/ x2 H/ _7 p. ]
) O/ j% V$ v) c2 c$ Z- N" e `& c1 u- D3 Z4 m6 h
max_fails: 达到指定次数后认为服务器挂掉 t3 s9 t( h. K& p- _
+ l, A; N7 Y5 p8 t* |- X
fail_timeout:挂掉多久后再次测试是否已经挂掉
0 i) p7 F6 p1 g" B6 o( m$ o4 T' J0 M7 O8 _
配置命令
) D: { T/ R0 p+ d, G8 U! d; ~
& V) E. O( v- B4 G1 Lserver 192.168.1.66 max_fails=2 fail_timeout=60s;
* ?0 U' Y, b# Q/ L* M. d4 ]2 \ P6 p* ^
后记
J% l2 [2 s* }6 I" t7 t% J我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。' \' G9 q# e$ F' A4 K
/ B5 z& Q2 b! O
: C2 U; l/ p3 U
) X r) F" j9 F" {
( F0 R' c, n& \" T2 U
5 p# i7 u% X7 M( s |