Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示,
) L, z( ~ E& i {1 S! p- X! M
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ ?/ b0 y3 s7 L( P( T( d
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。
3 \& w |7 R0 l. v! i7 N. H, o9 L0 Z. S! d* \% J3 u/ l
那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)* W' P5 J' C4 H% Y: }8 A0 u
/ g! n) L; e! @2 J; F8 C5 @2 U& ^) \) H, L3 H; f% r4 S
- worker_processes 1;) f9 x. v/ K1 _ V# v/ U0 ~8 g9 g$ s& P
- events{
复制代码
' P+ S& Z7 B- [( `+ v* J& a, S) o5 I8 K/ i
重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方8 e0 {; n6 P, g# u3 L1 \
; I) ^- \6 L% f& s6 B+ v/ u% z
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。4 ? ^/ O! R6 D# D% u+ M& y6 b
2 f$ a6 a1 U1 i2 G. Y* a
: L& L$ {- X, z" L* p' i
接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?
' n' p1 j M3 H0 s! J
( \3 w: T e( W0 R
$ ]$ l1 F5 P0 L
, M& o% o1 v) H& b1 H) n
& k, x! x. t. E# ?负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图:
, t. V& L" G2 a0 D! }+ P# ]
8 J1 m5 ~! s! N* |/ ~/ M5 V D- B2 s. ~- v! R s# [7 W
这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
% `0 N! n9 N5 X* `2 M( x 2. 加权轮询,使用weight参数设置,配置如下
4 @$ i) g, T l" g' M
' P" b; V, z3 P. e! G' l( u3. ip_hash策略 Y3 w- U# @1 c5 J6 W
(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
( F( z9 p" m9 Z& S, j# o2 ] 其他地方保持不变,在upstreaem中如下设置:; A" B! ^% E5 w0 m* V
+ Z* J+ b1 U D& b" S5 J* s
8 P. E0 ^ P5 M
; Q; |) R: A: D2 W$ ]+ Y. W y9 t2 Y* P5 M9 O8 N5 U. E2 p
4. fair策略% O- J( m$ P& b! |# k9 b
(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
/ u) r+ k! w/ X& E; R# ^6 O& E5. url_hash策略
2 N0 y* ~% {. Y9 ~5 W3 }) a# i) T% B& e
(类似于ip,只不过绑定的值是url,这个也是第三方策略)1 ~0 ?1 S. ]: B
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可
0 j, X7 ~: @3 R- R: {( h
% c) ^ [% t/ J$ C& }3 D8 w2 e
6 ?7 d; w6 T8 _7 P' M/ c
* u) {- k; O* s( E% r& U, Jurl_hash策略的用处?
0 `6 `" f- J1 ]7 N8 R' s6 n. T# W5 a# [7 F. f2 O* D. y
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。' ?+ m) x* d @8 ]. [, [ V
5 x6 B& U$ [' o; A* S
原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;
/ z! Q; N! y( U: W
( k2 N8 o5 I8 o- ]& m- B G' K$ a, ^* W8 J" [ a
g# Q, C! _4 Y
其他的配置0 b, Z6 {. ~ i$ D( N' N
备份与停机状态:
# e4 S" Q# I+ |server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
5 t! E3 z" x1 _6 c
% W6 H0 `+ }2 Dserver 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,
0 g) r* {6 v% f6 k4 T
& v% o. h% d I2 d' F2 Adown存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。
4 S0 r5 p1 ?+ w& `: r% a2 m8 z- b
. I! D- w8 m! _4 C2 s
- p" f8 }( \$ p( o! X- {. E+ Z5 e/ j
9 _8 E" k L/ m" F, kmax_fails: 达到指定次数后认为服务器挂掉
3 t& v: U9 y$ }- Y. [8 [( G
: i. x- Q$ `2 t2 D fail_timeout:挂掉多久后再次测试是否已经挂掉0 @0 a' ~3 F% n) J2 s; x3 N1 t
& h+ e: M! J) c. ^8 ~9 U3 q配置命令
- E+ l' j4 w" R+ E. A5 a: E& q
, z7 L- l: A: N8 k5 Nserver 192.168.1.66 max_fails=2 fail_timeout=60s;4 N6 z% }& B% y" T, z* u
# q: u5 q) x- D! _; a/ z* m2 ?4 k 后记0 w1 N! M. J5 ?. P
我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
. N8 u, P, N+ r( n. _, J" O. a0 |$ [8 u+ M
* o+ I5 \5 [% _& }
$ h! @1 p# b2 ]; H1 g
0 N* j/ D* S5 y( A1 M: V J5 z
8 F1 h- L# C; q& R4 O0 Y9 F |