|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示, , z1 Q0 f. A5 Z. z* ?6 S, }
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ ( ~6 z4 k& X% p/ n# v3 V+ R
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。
( n% c; l* U" N$ H8 u
" {' y7 F, U5 b那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)
# e5 M: F8 s6 m7 J( r, A4 V
! D5 M- _2 C, n7 N
" z/ `6 h; s$ S2 h- worker_processes 1;- I( K% j1 a. F- o2 R9 q( X
- events{
复制代码 1 a& _5 }; n8 s Y5 F
) l3 ]/ X( H$ v. Y9 I
重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方
( L) z- t$ O: l" {$ O. F1 v
2 B/ }0 C; a( b比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。
( n+ e8 ?6 r6 ~# l7 H; [ Y! w7 {# l3 B, D
/ A; B6 ]. Q- |; B8 q! [8 J& s
接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?3 J- \. N, z" S7 {0 ^
5 u* e$ I) p8 H; d F8 c
, |( f" B& ]; g
0 F& `* `7 L- d9 Y Y6 p$ y2 r2 _' M3 {/ P x$ C9 {
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图:
+ j& o1 q0 s7 L9 S
. \) {+ d# {2 y! W. q8 ]! d/ u, g3 ]6 J! [& X
这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。/ K2 `; ]2 A6 |0 `! Q9 j7 x
2. 加权轮询,使用weight参数设置,配置如下+ ^+ J, z4 s. z; \+ C7 Y- E
6 v6 F$ C- V J* W1 w. X& S
3. ip_hash策略
i2 `1 L8 X9 I(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
# A+ q6 `8 f9 Z 其他地方保持不变,在upstreaem中如下设置:& B7 x c4 N: Q2 M: g3 M# Z6 S' k
1 \% m1 @/ h( T
) M/ A( r4 X0 U2 y; V" B
. x( F8 Z1 R4 o$ d: s/ o
" q; w) A) V' I0 x5 d/ F6 W4. fair策略
) [5 w0 F- M/ M( J* n# s8 X(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
4 y$ ]3 N% `2 C8 i7 H0 Z0 N* e5. url_hash策略) C2 G; V* J2 f u- n
. `1 Y6 h0 `8 E5 E1 f( L(类似于ip,只不过绑定的值是url,这个也是第三方策略)
4 W. y i0 J' Cfair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可6 ^# {1 }' [, S3 K
" P/ ?! j) z7 {8 ?1 L4 Y% s
, r# d1 D) m6 ]2 P0 r3 w0 P7 i/ [# X$ s k/ Q7 A* h9 c
url_hash策略的用处?, ]' _; O* h1 L8 ~4 h+ m" v* U
9 M( k: u. x9 k$ x% ]0 ?url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。, M4 n" X6 Y F1 O, K/ @
/ S) K- f% G. y7 z! b! R7 t5 b
原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;
! ?7 j" R+ H v, B3 a( f
1 S$ l. }+ k$ \: H' T/ b/ _
4 \8 T9 B) }* F
- `6 A1 U9 F1 g4 r其他的配置
/ b7 ?) o9 Z4 g2 y4 t+ d% Q: g0 ?0 A备份与停机状态:+ |1 b, w) o! I2 n- O
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;( ]8 v1 {& e- {2 A! _' P
) Y/ {7 }2 p# @5 K4 ^1 M! D- |) Q
server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,
/ h! U* A/ {$ ]- I1 Y) h2 n! w7 g+ {; b& J1 C6 z O( t2 Z# X7 @
down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。6 \+ }* G3 P; ?$ }% p
( o0 q$ L( {* b: i" t0 T- c( h* n. Q2 a
" y+ g% P: m4 P' d- v
max_fails: 达到指定次数后认为服务器挂掉5 U+ B* \- P9 { o/ }* j( |' h
# P- S/ }& Q* _0 v. l* ~7 q3 } fail_timeout:挂掉多久后再次测试是否已经挂掉$ E1 x- o# b' G) y2 s m
& A# f3 t% D( a+ v% U1 l$ r$ e配置命令( p& z- E7 d3 [. k. M
$ L, v% M. F0 Z/ J' b
server 192.168.1.66 max_fails=2 fail_timeout=60s;* n9 e$ D% Q- z7 y) e1 X
5 e, L& Q6 ^- \% }9 H 后记
V, {0 [. H( R+ }$ @我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
$ J; J [3 Q+ w5 a. ?: R/ D c$ M5 h+ m% A' [# K" c! `/ K. I# M
4 f" C" O1 N: G: \; u0 u" I) H3 f) @* \$ ^. E
8 p) [7 r/ p4 @( |4 U, J
, A7 F1 S6 v" U' L. K |