|
Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
/ Q9 B: a( m ^2 n, m# r$ U6 g8 M
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ 9 f7 d$ q! T1 U; `
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。- U! Z4 v7 Z9 N4 D V
: `8 s6 W+ |: q7 v) K+ r3 b那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)
& T' U; H# d9 L% w$ E0 g' W, f- q, _& o# u& @; t1 v
% p/ z2 L6 t7 ]1 g4 ~5 y- worker_processes 1;/ t6 ~) B9 O7 a# w/ J3 x+ V2 k+ Y
- events{
复制代码
) j1 d! h3 n: h. y0 i* V+ ?
# [$ V7 P- |1 |4 v" C重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方3 C' Y: P! C' R! o8 I7 l
$ X O; {' G4 ~& w
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。
& y% E% ?* C6 i- K' a5 S0 _4 j
9 i- {! ]) ^2 n" f" R( O* N
9 P: E$ y, d5 \5 g! D" m- b, u接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?
3 f5 a( {; G7 q' Z" e/ @" }7 b
. s9 {% x" O2 F7 M2 Q; v
9 R/ b9 s" o, w" q% [3 g% i+ r
2 E2 x- _( o" z7 b" c# P9 B
" e! t2 A/ ~, v
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: : n! e2 _) N& i0 O" L
( k; G) M2 q7 p2 H( Y
" K4 a5 _* A2 i2 F) r这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
% S. [5 P5 `0 |6 \# R 2. 加权轮询,使用weight参数设置,配置如下" O4 Q+ _6 W# q) E$ P' k0 J( H
" C5 w3 E7 U" \3. ip_hash策略
: i' b6 F1 i4 T' b5 k(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
) l3 C, Y( o; ^" s+ z [& T 其他地方保持不变,在upstreaem中如下设置:6 z- o/ `" s7 h5 U* C% Z' {
- D3 ~+ V) R3 |4 x( c
J" G+ Z' ]& |1 Z p! |
% ?6 U" P5 Y& n5 ~! j
& u! s0 m6 K5 v+ H, w k8 J
4. fair策略
* H$ W' O9 |) B8 _/ J(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
5 S+ ], N: Z0 Y; e5 x5. url_hash策略/ ?" p* ~, s o6 z9 ~
2 U! {0 N# g# k* ?(类似于ip,只不过绑定的值是url,这个也是第三方策略)
! P* h: r3 V0 e/ bfair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可
; S0 f$ g6 U0 u! ~
% v; k1 b( g% e- F! z+ Y* R F4 ^4 U! K
: p; M0 E' N" t! }; l9 k6 c4 p3 z$ G
url_hash策略的用处?% d& d7 p& V" ^- B0 F5 e6 }
9 L" Y$ ], R7 q) u# Jurl_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。
% |' ?3 H* k0 C
: @: ?2 L& J, }9 K1 `# G原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;
8 R7 r7 {' j X2 E( `( w" ?& @0 ?6 e4 z! t! b' X
3 X9 z. X% \# o8 A
/ d1 @: S( u4 E! c G6 o8 d9 T
其他的配置9 W3 x: W% E! H' {0 J
备份与停机状态:$ j9 l! j6 V+ R
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
; v, z$ ^2 K# l8 A4 n' e" ^- B2 q) c* l3 g; A2 N
server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,
, X- H1 p* |# U* m8 c
2 W6 B5 T( r1 j$ m/ m5 ]* |down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。' q* [: I; j* k) [- T* R+ Y+ f$ _
+ S7 B+ d; E! r6 u* d% A9 O
/ Z" d9 ~5 C% U: y4 q& T
+ j: `) {! @4 O3 ?" d0 ^' xmax_fails: 达到指定次数后认为服务器挂掉9 W8 R3 ^& e2 W; r# }
- l- K+ V0 r7 J5 ]8 M% L( t
fail_timeout:挂掉多久后再次测试是否已经挂掉
+ C2 J* r5 y' `6 Q1 L: b
) |1 y: O* |9 f# D5 {" X& W配置命令) P7 \, w: ~: L
: g9 l: b& P1 E9 u% j/ O0 |
server 192.168.1.66 max_fails=2 fail_timeout=60s;
/ C& r- G) n, G- v8 a) g8 o; |8 a6 A: u4 G0 l+ N
后记- J1 ?! N7 D3 |7 ?' j( P
我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。, m3 u8 ?. o$ z0 X
0 D$ u; R/ V: o& o0 M! m
; X" B4 [" s) `* I" N% F3 R
6 N- t/ b, A. [2 t* K) F; ^+ J( E% V: k) e' `: ~1 x
- g( E' n& g3 u+ i- e4 K# Z/ o |