|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
- g3 E0 `7 a2 ^, T' _ n
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑
6 M+ T! T2 a% ~: Z# T1 }从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。
( R( u' y: w1 r" E' _7 T5 W
. C2 Z$ E1 B9 H. e1 G* ~% {, c; E那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)
5 W9 G, P5 @% [5 e2 s
7 [" d4 t0 O5 C, @' v$ ^9 K1 E( o! T5 S
- worker_processes 1;
0 ~$ R8 k# V5 g1 Y* D9 U5 [ - events{
复制代码 6 S m+ |4 i* O" D+ D' R, i
$ o9 q0 q0 J1 \& ]% H; t5 P, L重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方
3 b1 ^+ ^/ y# e* B1 [# E. v$ {0 w$ d; R* J9 V" g+ H2 \, C
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。
0 _8 o7 q/ u1 q7 B: C2 Q. R, D2 ~* C. T* T6 W9 T& L8 A
9 g# T2 G( q e0 ]4 t4 m9 n接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?' y$ V) k! K$ z% L( {
. r% S! x5 v4 a5 Z* n) n. z; A
4 H' ~' C4 j/ o1 s- ?0 r5 z
# l T) V2 X# T8 i8 o2 v% ]+ a
" P. v @" R( b% u/ M; h. t负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图:
5 ]9 i3 [5 @# x: y1 l. i
/ Q% n/ Q4 Q* j0 `- ~4 M7 q
6 l! d7 @! U) B ~. d这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
# B, s4 C" [$ c3 n- x) ^# c 2. 加权轮询,使用weight参数设置,配置如下; K+ H2 N3 Q: X9 b( G/ h5 N
6 Q# ^4 A/ E6 @/ V6 `1 N6 V4 v% u, K
3. ip_hash策略 A" X) e5 E2 ^& u& p* `; [2 [
(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:3 l2 ]# z z* Z% ?8 |
其他地方保持不变,在upstreaem中如下设置:
" ]. _$ P- ?' L- t) j" t! T" `9 E+ \1 |
0 j" M' p8 @; Q8 a
2 \# t! @7 `5 k+ w- n: G; m1 |4 a/ M- {) D% \
4. fair策略1 m" M& @9 {1 V: d9 E
(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
! o- c9 [) M' @2 m' @ w& H5. url_hash策略
+ t7 U0 P, D: R. @- s2 @7 Y, a( f m% {% b
(类似于ip,只不过绑定的值是url,这个也是第三方策略)
0 b$ L5 S g: b7 Rfair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可; i9 ?, z: V8 `* {. s+ S2 q
+ i! ?1 Z1 ?- i
0 J/ b& @: W% Z* u5 m# m. e
5 I" t& E- a$ S# J" ^url_hash策略的用处?
; C; d. ~( x' A7 z
5 n0 X+ N @: {5 y' H! Curl_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。
4 `8 S# m* y! {5 |1 k* t) S& N% L* D" R, {. {* P- D
原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;
! i7 ?9 y; h2 o4 _$ P) T: U/ N5 U
" G$ a' y4 T) F
* F1 ^4 z3 p, m4 \% I
) w7 _! `, o. f9 S$ t其他的配置8 n. j" B1 h8 g3 |, X9 i
备份与停机状态:* G4 Q c8 Y! {. Z3 u c* }
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
1 } D/ B( c5 ^( i
4 | c% L; H2 f* q5 w: Qserver 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,6 D9 [, z: Q5 R; _+ d
y$ p( Z2 i+ ]; c" W! ^) o. c. p. u* @down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。, K" ^, g# s' l2 ]- X
$ i* r8 N' u2 l" |) k
+ d( U( Z# z6 v, `
1 ]9 V2 j" g* T& F8 q; N6 v9 c: \max_fails: 达到指定次数后认为服务器挂掉, T M5 O$ I8 U: i# z
. |8 {4 r8 ]) i2 o1 s4 T. m fail_timeout:挂掉多久后再次测试是否已经挂掉) \! ]; J7 L4 ?, x C
+ b$ Y" }* O c& T6 P y配置命令$ n0 ] r, Y$ N' b% v
' V" T7 J# i9 mserver 192.168.1.66 max_fails=2 fail_timeout=60s;
" U2 ?( j9 B& z9 n0 q4 r- h, t
( d7 l/ f7 N+ y- r 后记: o7 J0 b j$ D' x7 ?
我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
! \& ^4 S3 l+ X: x4 A# @" n
; k7 V/ v: Z) Q, u4 s$ H: I
- z) H( `* J; U5 p5 Z+ h8 }0 }0 B- R: L
% k4 Q& q. d! j; l- j
6 w7 U+ H% B+ t) l( z |