Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
7 Y4 @: I y/ T4 i5 o$ S
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ " I( Z7 q5 P% {7 H
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。 @" D: G" n, j9 T. i; P
6 |! {1 V4 { [; o& u( s
那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)' P% v' [* y( q" A* B+ G
% m, Z( V' O- P( h$ I" ?/ y
8 J4 T4 l* f3 K- worker_processes 1;$ J$ q2 O- H& k0 N! J
- events{
复制代码
9 S: T: o6 d: _8 U* S/ H3 X6 q4 d' l) d+ E, b! s
重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方; t% \( r9 Z# K% ]/ I9 t7 g& x
6 R" |8 f1 s4 O8 H8 x& I
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。
* J; b! W7 i4 p/ c% v4 i5 S% Y ]' O
4 V1 l3 m! |" z" A3 y. a
0 _* J+ F0 X1 {5 d$ j接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?
+ }# s$ \/ z; N9 w( D1 n8 B) @: Q9 N0 v; m5 o
2 \- `0 \7 U/ F1 @
/ R! b6 ]( W) h' ] V# r* j
7 [6 p+ q' C, _1 h2 ~负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: 0 f$ L3 |( j! p6 k) c
& B# _0 {6 I* H! r- q
" ~6 S7 u9 m3 X! f: B( Y, k! U5 y6 h
这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。2 |9 |* v. x7 g. O) O# V
2. 加权轮询,使用weight参数设置,配置如下
* x$ T& i! J( T/ ^- q
: h7 y: K. O3 o3 {7 D3. ip_hash策略
7 W. B$ i! r4 Z! W2 z1 }(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:/ C, O6 o/ Q8 u3 }5 [9 [+ |
其他地方保持不变,在upstreaem中如下设置:
! Y* L; ~) r; {! w @: L& g/ Y# a: E/ C7 h% f" }
! X9 |9 ?# Y1 n: T7 R
8 ] Z& S7 W2 U6 I$ c. D% `6 }) g% L- S: i" ]
4. fair策略) |. o+ Y* M. ?9 ~
(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
, {0 Q9 U: R: c' O+ C5. url_hash策略0 `9 t% V/ M/ E8 k
% \+ m' U. I3 s9 c7 f j% Y
(类似于ip,只不过绑定的值是url,这个也是第三方策略)
s, D" H. }, x; J& @+ u, X5 Cfair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可
* l# \5 O; J6 u- f* J8 _7 z
* S" O& s4 c+ p$ {* b& `2 M z4 c% ? x/ C
8 M7 p; U+ f) a a( ~url_hash策略的用处?, v1 ^! S7 Q4 j6 }% [
; W( O+ j3 t M5 T: [' z9 _
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。
- Y w0 n9 }. L+ v) G* g0 Q# p* }6 }8 m. k" f- E
原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;/ [0 Z2 Y4 p* R# J+ z* Y/ m. e
4 i3 T9 Z) N; n9 w" O0 Y
4 O, }# ^" U/ N) l0 L5 y& F+ B: o8 ?, a; F& Y, c9 y) T) ?
其他的配置
' V9 z3 n; p# h* I. Z. ^备份与停机状态:
7 e% T+ K: D7 y1 nserver 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
; c, V- U: o2 D
( T, j3 `! {2 X d) Q! fserver 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,
9 t! ~/ a7 a1 D. z9 Y Z: h4 k4 K& a1 x8 ~
down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。5 I8 _& h8 m1 d. m
! D( H, `5 }6 `
6 |. i; I$ y/ P* o7 t v' b
1 W. O9 E' A' h4 |! W* E+ ?8 z" Kmax_fails: 达到指定次数后认为服务器挂掉: a# ?% p1 ]& h! y+ D
. i, B' q( T/ V7 l
fail_timeout:挂掉多久后再次测试是否已经挂掉9 D4 o% Z% T9 K: h# ~+ ?
( } C( ?5 Y' E# R* r" l: t
配置命令
) i e1 W6 V' L& }( ^- y
. i4 Q- [8 T7 ^( R2 Y9 `7 ~4 h$ Gserver 192.168.1.66 max_fails=2 fail_timeout=60s;
6 q2 w7 ^6 Y! u X
, L8 G/ K1 H/ d& Q 后记
, z8 ^8 M+ E5 ^5 a我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
0 E0 v/ `! |, F" T7 _3 h! j
+ |# |; l# I X' @+ \0 ~, A8 P# L5 e; R3 c* i
( @7 @' l$ ~2 I( F& a6 A% O$ ~
5 z2 n: H# J+ H
4 H: t( y# b) ~( F |