cncml手绘网

标题: 反向代理与负载均衡扫盲(初识) [打印本页]

作者: admin    时间: 2020-2-25 23:22
标题: 反向代理与负载均衡扫盲(初识)
反向代理
  1. 提到反向代理,就不得不提到正向代理。两者虽然都是代理,但方式却截然不同。所以,在我们介绍反向代理之前,先看一下什么是正向代理! ^" j/ s  G: A" C" i& M/ Z
复制代码
正向代理介绍
  1. 正向代理(forward proxy):是一个位于客户端和目标服务器之间的服务器(代理服务器),为了从目标服务器取得内容,客户端向代理服务器发送一个请求并指定目标,然后代理服务器向目标服务器转交请求并将获得的内容返回给客户端。7 m9 i; j4 `0 W. j( Q/ ?2 C+ U
复制代码
有时候,用户想要访问某国外网站,该网站无法在国内直接访问,但是我们可以访问到一个代理服务器,这个代理服务器可以访问到这个国外网站。这样呢,用户对该国外网站的访问就需要通过代理服务器来转发请求,并且该代理服务器也会将请求的响应再返回给用户。这个上网的过程就是用到了正向代理。
3 s$ x! _% [& r& v

& Y% a$ W/ H7 {. u1 N3 m# u5 F
7 g4 I3 ]% i& C
这个过程其实和租房子很像。
+ ?7 o: L) r$ c3 S7 s
租房子的时候,一般情况下,我们很难联系到房东,因为有些房东为了图方便,只把自己的房屋信息和钥匙交给中介了。而房客想要租房子,只能通过中介才能联系到房东。而对于房东来说,他可能根本不知道真正要租他的房子的人是谁,他只知道是中介在联系他。这里面一共有三个角色,租客(用户)、中介(代理服务器)和房东(国外网站,目标服务器)。引入中介(代理服务器)的原因是用户无法联系上房东(用户无法访问国外网站)。: }% j. G% F3 i  k
' S8 F; _0 @' H- V  H3 F' Z
所以,正向代理,其实是"代理服务器"代理了"客户端",去和"目标服务器"进行交互。通过正向代理服务器访问目标服务器,目标服务器是不知道真正的客户端是谁的,甚至不知道访问自己的是一个代理(有时候中介也直接冒充租客)。
% x1 }+ @6 k; ?+ x
* d5 J! g" A( B1 W正向代理的用途
! l/ e* ~9 R( r$ T. b9 M" d' R- R8 u' H1 h; ?
反向代理介绍9 J5 X/ z1 D* I
4 Z# a& O) D% W4 i; t4 p+ O
  1. 反向代理(reverse proxy):是指以代理服务器来接收internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上请求连接的客户端,此时代理服务器对外就变现为一个反向代理服务器。/ g) _) i. S) }/ u2 z( ], F
复制代码
反向代理(reverse proxy):是指以代理服务器来接收internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上请求连接的客户端,此时代理服务器对外就变现为一个反向代理服务器。% V$ t1 `! `/ C& x
  T/ }/ M& W  a1 G$ _

* Y8 b& O! ~3 f* t; D5 W
前面提到过了,为了提升网站的各方面能力,我们一般会把多台机器组成一个集群对外提供服务。然而,我们的网站对外提供的访问入口都是一个的,比如www.taobao.com。那么当用户在浏览器输入www.taobao.com的时候如何将用户的请求分发到集群中不同的机器上呢,这就是负载均衡在做的事情。

9 t6 w% I" ~: F  b( }. @3 G8 `
" y* ]3 j+ u& y, g9 ^6 |
& Y& y) Y# j* B+ c- K, I# S
在这七层模型种,高层次都是依赖于低层次的。层次越高,使用起来越方便。
- P6 U/ S3 h  B3 O/ f

4 @, i+ e, n- E1 Z" {! T
% \8 q6 v! e6 j. n( I, @- f9 g
4 q2 k9 [1 g% [# t7 F2 I( {

  c& I' _; L8 o$ g& ]/ H7 h' [/ h 9 ?. I# D6 Y& z1 f; E8 e7 r  g+ U
$ k4 {1 @9 Y% w8 u+ H
我们经常听到的一些和计算机网络有关的概念中:
  1. telnet、HTTP、FTP、NFS、SMTP、DNS等属于第七层应用层的概念。5 O: P8 l5 ]& i- ]9 W- J( B5 v) R

  2. % t; y" o+ a6 h  e2 W( C
  3. TCP、UDP、SPX等属于第四层传输层的概念。
    0 V1 a$ P/ {5 U( d' M4 A5 d  t

  4. ! ~0 Y7 f- Y6 v6 c
  5. IP、IPX等属于第三层网络层的概念。
    ( s0 v4 V% H' n6 ]4 R; Q% |

  6. 0 M7 D, f# f  h; W
  7. ATM、FDDI等属于第二层数据链路层的概念。) E3 `) U5 K* N
  8. : J/ _5 \" [& a1 u9 n
复制代码

- o( q! X* d9 e2 P7 N3 C了解了网络协议的七层模型以后,再来看看负载均衡。我们可以很明确的一点是,负载均衡是要在网络传输中做文章的。而要在网络传输过程搞事情,那么这七层模型就势必躲不开。
; r; O; F6 ^; s& f( O0 {* f/ `4 t; O0 O
所以,根据负载均衡技术实现在OSI七层模型的不同层次,是可以给负载均衡分类的。$ E6 p. \% j" r! ^( b6 e

* _1 ^  U0 R5 U/ v, g. U/ C5 D常见的实现方式中,主要可以在应用层、传输层、网络层和数据传输层做文章。所以,工作在应用层的负载均衡,我们通常称之为七层负载均衡、工作在传输层的我们称之为四层负载均衡。* e/ B! f8 g: ]

, P& q. A& T7 M, I大致可以分为以下几种,其中最常用的是四层和七层负载均衡:
- {, O, u, }- B! l% n! J9 S# V, p5 F- H( v$ g

8 _! H4 N0 \- D9 i, Y负载均衡工具
' U8 t4 D0 q8 h. l: y市面上有很多开源的负载均衡的工具或软件,基本都是基于前面提到的方案实现的,大多数是工作在第七层和第四层的。Nginx/LVS/HAProxy 是目前使用最广泛的三种负载均衡软件。/ k4 u! u# R  ~" v. _
5 V! K2 F- U8 v# `3 G( `9 t) I/ n
LVS; L9 |- X4 f* Y. {4 G/ y4 E
LVS(Linux Virtual Server),也就是Linux虚拟服务器, 是一个由章文嵩博士发起的自由软件项目。使用LVS技术要达到的目标是:通过LVS提供的负载均衡技术和Linux操作系统实现一个高性能、高可用的服务器群集,它具有良好可靠性、可扩展性和可操作性。从而以低廉的成本实现最优的服务性能。
) Q$ c3 h2 [' R# _- `$ z0 S: s7 `: X' j- i+ h3 f
LVS主要用来做四层负载均衡。1 p% h! t6 Z- E: d2 H" r

7 ?. p; _4 W! J9 o; h; uNginx
" q: D: }4 [0 \1 fNginx(发音同engine x)是一个网页服务器,它能反向代理HTTP, HTTPS, SMTP, POP3, IMAP的协议链接,以及一个负载均衡器和一个HTTP缓存。
$ C) P& r3 _1 _2 h5 |" W3 O- b0 o3 G3 e: M+ K% F/ P$ o& u
Nginx主要用来做七层负载均衡。/ Q* v+ K" ]3 z7 ^" L) l( u2 d! u7 H

5 u( u6 N5 D0 ~- h7 O$ c7 ]HAProxy
* B3 |5 ]: T4 T2 y) p% B/ oHAProxy是一个使用C语言编写的自由及开放源代码软件,其提供高可用性、负载均衡,以及基于TCP和HTTP的应用程序代理。8 k8 A% N! n5 R& v. O: D5 u
1 D1 v; g' M$ |1 R; E
HAProxy主要用来做七层负载均衡。3 o: {; g/ y+ R8 I) C1 i! Y0 E4 W. r

/ ]) O- |( Z! `; B: q负载均衡核心:负载均衡算法实现
; h: }$ B% v: `负载均衡服务器在决定将请求转发到具体哪台真实服务器的时候,是通过负载均衡算法来实现的。负载均衡算法,是一个负载均衡服务器的核心。+ q+ O) y" A: [, i# f7 `

' g4 @5 M* c2 R5 F- I; E9 G. N就像电影院门口的引导员一样,他根据什么把排队人员分配到具体的入口呢?是哪个入口人少吗?还是哪个入口速度最快?还是哪个入口最近呢?如果来了一个VIP怎么办呢?8 T( u& Y& X5 x, p' B5 W% F% ^0 j

/ g+ [1 ^. j; F  R( G) M; G; I负载均衡算法可以分为两类:静态负载均衡算法和动态负载均衡算法。
5 o' C. C' E" H5 I' e1 v$ N/ }; O) w6 h; f8 }
静态负载均衡算法包括:轮询,比率,优先权' a8 ^; @4 a% B2 S7 h' j; Z; a

  P3 q& `/ f0 ]% V. \3 d动态负载均衡算法包括: 最少连接数,最快响应速度,观察方法,预测法,动态性能分配,动态服务器补充,服务质量,服务类型,规则模式。
4 J5 q/ b# n/ y$ B9 s' d
. {, x" f  b8 r5 k: |. b6 C0 k# K' [" o
以上,就是目前实现负载均衡的主流算法。不同的负载均衡服务器会选择不同的算法。就像电影院和火车站可能会选用不同的引导策略一样。火车站可能会把行李少的旅客分配到一个专门的入口,可能给即将发车的旅客分派到特快入口,手持可扫描车票的用户单独分配到特殊入口等。

& m9 o% C9 I( E, E# e! |& t! j. v) z2 e8 S% h7 M
( ~9 t: H/ q& w, H$ n# G) p) o( Q
# X6 B; h) X, [; l( L4 z
; F1 l. s% e% n& F- N
' q0 Y& @1 A7 [& T+ {! B
% R: r( A9 }& y" a, E

  v, H6 G* V, J4 v. Z  T




欢迎光临 cncml手绘网 (http://bbs.cncml.com/) Powered by Discuz! X3.2