最近有小伙伴来问我,说让我分享一起关于负载均衡的理解,我说,网上有这么多资料了,
怎么还需要我来分享,他说网上的很多资料不系统,难理解。因此就做了这个视频。
另外,我花了很长时间,准备了一份500页的PDF面试资料文档和一份10W字的Java总结面试题和答案,
接下来,我从负载均衡产生的背景、负载均衡的实现方案、负载均衡的作用范围、负载均衡的常用策略四个方面来进行分析。
1、产生背景
在互联网发展早期,由于用户量较少、业务需求也比较简单。对于软件应用,我们只需要一台高配的服务器即可完成业务的支撑,这样的软件架构称为单体架构。
ENTER TITLE
随着用户量的增加,服务器的请流量也随之增加,在这个过程中单体架构会产生两个问题。
1. 软件的性能逐步下降,访问延迟越来越高
2. 容易出现单点故障
如图所示:
ENTER TITLE
为了解决单点服务器的问题,我们引入了集群化部署的架构,也就是把一个软件应用同时部署在多个服务器上。
ENTER TITLE
但是,这个架构的变化又带来了两个问题:
ENTER TITLE
1. 客户端请求如何均匀的分发到多台目标服务器上?
2. 如何检测目标服务器的健康状态,使得客户端请求不向已经宕机的服务器发送请求。
为了解决这两个问题,引入了负载均衡的设计,简单来说,负载均衡机制的核心目的是让客户端的请求合理均匀的分发到多台目标服务器,由于请求被多个节点分发,使得服务端的性能得到有效的提升。
2、实现方案
ENTER TITLE
实现负载均衡,一般有三种常用的方案:
1、基于 DNS 实现负载均衡
2、基于硬件实现负载均衡
3、基于软件实现负载均衡
先来说一下基于 DNS 实现负载均衡的方式,它的实现方式比较简单,只需要在DNS 服务器上针对某个域名做多个 IP 映射即可。
ENTER TITLE
它的工作原理是:当用户通过域名访问某个网站时,会先通过 DNS 服务器进行域名解析得到一个 IP 地址,DNS 服务器可以随机分配一个 IP 地址进行访问,这样就可以实现目标服务集群的请求分发。
除此之外,DNS 还可以根据不同的地域分配就近机房的 IP,比如长沙的小伙伴,可能会得到在湖南范围内最近的一个机房的 IP,在这个模式下可以实现「就近原则」实现请求处理,缩短了通信距离从而提升网站访问效率。
DNS 实现负载均衡的优点是:配置简单,实现成本低,无需额外的开发和维护。不过缺点也很明显:
由于 DNS 多级缓存的特性,当我们修改 DNS 配置之后,会因为缓存导致 IP 变更不及时,从而影响负载均衡的效果。
第二种方案,就是基于硬件实现负载均衡
ENTER TITLE
硬件负载设备,我们可以简单把它理解成一个网络设备,它类似于网络交换机,有以下几个优点:
1. 它的性能好,每秒能够处理百万级别的请求,
2. 支持多种负载均衡算法,我们可以非常灵活的配置不同的负载策略
3. 它还具备防火墙等安全功能。
4. 硬件负载是商业产品,有专门的售后来支持,所以企业不需要花精力去做维护。
比如:F5 是比较常见的硬件负载设备,由于硬件负载设备价格比较贵,一般应用在大型银行、政府、电信等领域。
第三种方案,就是基于软件实现负载均衡
ENTER TITLE
所谓软件负载,就是通过一些开源软件或者商业软件来完成负载均衡的功能。常见的软件负载技术有:Nginx、LVS、HAProxy 等。
目前互联网企业绝大部分采用的都是软件负载,主要有以下几个原因:
1. 免费,企业不需要投入较高的成本。
2. 开源,不同企业对于负载均衡的要求有差异,所以可以基于开源软件上做二次开发。
3. 灵活性较高
这三种方式,没有好坏之分,只有是否合适,因此大家可以根据实际情况选择。
3、作用范围
负载均衡是作用在网络通信上,来实现请求的分发。而在网络架构中,基于 OSI 模型,又分为 7 层网络模型,如下表所示:
ENTER TITLE
这也就是意味着我们可以在网络的某些分层上做请求分发处理,因此根据这样一个特性,对于负载均衡的作用范围又可以分为:
ENTER TITLE
1. 二层负载
2. 三层负载
3. 四层负载
4. 七层负载
二层负载:基于 Mac 地址来实现请求分发,一般采用虚拟 Mac 的方式实现,服务器收到请求后,通过动态分配后端服务的实际 Mac 地址进行响应从而实现负载均衡
三层负载:基于 IP 层负载,一般通过虚拟 IP 的方式实现,外部请求访问虚拟 IP,服务器收到请求后根据后端实际 IP 地址进行转发。
四层负载:通过请求报文中的目标地址和端口进行负载,Nginx、F5、LVS 等都可以实现四层负载。
ENTER TITLE
七层负载:七层负载是基于应用层负载,也就是服务器端可以根据 http 协议中请求的报文信息来决定把请求分发到哪个目标服务器上,比如 Cookie、消息体、RequestHeader 等。
ENTER TITLE
4、常用策略
所谓负载均衡策略,就是决定当前客户端请求匹配到目标服务器集群中的具体哪个节点。常见的负载均衡策略有,轮询、随机、一致性Hash和最小连接数。
ENTER TITLE
首先来看轮询,也就是多个服务器按照顺序轮询返回,这样每个服务器都能获得相同的请求次数
ENTER TITLE
2. 随机,根据随机算法获得一个目标服务地址,就像古时候皇帝翻牌子一样。
由于该算法具备随机性,因此每个服务器获得的请求数量不一定均等。
3. 一致性 Hash,也就是对于具有相同 Hash 码的请求,永远发送到同一个节点上。
4. 最小连接数,根据目标服务器的请求数量来决定请求分发的权重,也就是目标服务集群中,请求更少的节点将会获得更多的请求。这是负载均衡中比较好的策略,真正能够实现目标服务器的请求均衡。
以上就是关于负载均衡相关的内容,当然,负载均衡还有很多值得去挖掘的,比如负载算法如何实现?网络分层模型的原理等。对于网络模型这块,如果有想深度学习的同学,在下方留言”想看“,我会在后续的内容中进行整理
最后,我把之前分享的资料全部整理成了文字,希望能够以此来提高各位粉丝的通过率。