Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
' n6 u+ }, X% z! r
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑
* U0 N8 d9 i& k- p从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。
4 ~7 E6 ~0 ^( i b: c! }; R2 R
$ @2 ~7 s3 n- H# ^) R那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)
6 i! ^ M! ~. O9 ?& H/ D! i/ V9 S6 b4 Z: h3 o- m' N# }8 V
4 h0 U1 c# q! Z7 v0 Y# |5 c* R- worker_processes 1;6 G, o% x% I% y. E
- events{
复制代码 # i0 n4 _* ^- J5 r( R, f" V7 j. m" k
' {3 a4 i& w! n) S2 U% f7 u重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方) b9 v' Z6 E0 U5 K+ s4 J) ~+ K
# Y2 r; ~! {" Q4 m% g) P比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。1 P' W. x7 T& [
. T( q! _* ?9 E: l- }& G- T
: `# }6 N( u7 l ]/ o
接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?+ }7 k: e/ L6 ]; f9 y' i, C
& m! y u! `: a; @6 A
$ q' M5 M8 ~2 J! [, f$ l1 i6 {
% w! P8 d/ o2 _/ A( a* p0 P" J
% }" a% X3 c! T$ D; E$ ^负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: ( P- p2 T/ M$ h. I+ B2 _9 v( ~
2 l& @! ~# q' g' U& H
+ _7 U5 ? u0 [! y. k ]这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
/ g8 ?" H! t9 V+ J) z! A9 t' V/ c 2. 加权轮询,使用weight参数设置,配置如下
+ f5 `4 O# ~2 Y4 ]6 A7 _8 x
+ M8 p. P G" U2 s! g9 Z3. ip_hash策略
! x" J9 q1 G3 F* r(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:' t; T: b9 K. J
其他地方保持不变,在upstreaem中如下设置:) G, A# m P6 ]
6 H) u2 h3 L( J2 ]
4 z+ l4 }2 _4 C9 z) h$ p
7 ^( d6 ?; f" l2 _, g) m! K$ R8 `" n( ^
4. fair策略% Q8 T. D: s- [$ a- p" U
(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
4 J+ R! e2 C5 E @3 x7 I! I/ G5. url_hash策略. a+ b* ~' u- I% X0 e
& B. O* Q9 g( { e# x3 o+ b) [" {
(类似于ip,只不过绑定的值是url,这个也是第三方策略)8 h3 X" x* D! u1 z. ]6 J( u
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可
8 }6 F% ~4 T) P3 w# f' H. B
7 P, o: q7 H' ]0 n& Y# L! [7 h- _
3 Y0 b1 H5 j7 C: ]3 Z! x% H# B% E. Z1 z# C4 Z- G) v2 C* H
url_hash策略的用处?
- `# ~) f" P* V \( ?; }7 d) O/ t9 y% N
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。
9 G2 v; N2 }; s3 [0 L) Y, b. C- N0 b5 J2 |4 Y& K9 j- n
原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;: w: N* q) T, ?, z' v
; p& u: F X+ A7 ^( Q( @- q: G2 U
6 r+ n) d7 a. R* S( {
( K2 B+ s/ m) O. E1 n5 H1 {其他的配置
' c8 _7 G j$ b4 \) w备份与停机状态:1 f' Q( ~& T5 @; A& r
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
) h9 I3 p3 c2 Z, j9 N$ W3 ~0 p" n% J' ^1 b8 M' }# C5 |
server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,
+ m0 V5 R+ r4 G
+ j' `% o- K# O0 l8 J( }! s! cdown存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。: M! T# ~7 G- m3 _6 z
8 q; |) |$ R0 K" g3 T5 w
4 I- p; [/ j+ M+ p; O: w9 K# Q6 n8 H Q) }3 }+ |
max_fails: 达到指定次数后认为服务器挂掉, X4 G0 N. H8 `6 j5 N$ A* t
0 _6 A2 l. q+ h' X1 H9 e2 x
fail_timeout:挂掉多久后再次测试是否已经挂掉! u' h- J% l( P, ^, L1 K; d
: Q& A* n5 J5 y" O) p7 R配置命令, P# }/ F% g3 o) @ r
" ~. B* s3 `) Q; p2 o" jserver 192.168.1.66 max_fails=2 fail_timeout=60s;4 ]6 z6 ]* ~" d) u4 _
" P0 s$ ]' { X/ `- {# |( u' B 后记& t) T7 \$ ^& c( U) k% g& o/ _4 }
我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。1 h' b, [+ D9 T& B, l3 M
) N8 C" F' {$ k9 l7 ]' _9 G5 ~3 R/ f! c
7 @; \- x+ g1 F9 s: @: j" A
8 E/ Z5 u' A0 {- ^1 }& l) d! I
$ a: m8 |; p8 q: g. |0 F) U+ B$ H
|