Linux运维工程师面试题(3)
祝各位小伙伴们早日找到自己心仪的工作。 持续学习才不会被淘汰。 地球不爆炸,我们不放假。 机会总是留给有有准备的人的。 加油,打工人!
1 LVS 的工作模式有几种,分别是什么
三种:
- NAT 模式:修改请求报文的目标IP,多目标IP的DNAT
- DR 模式(默认模式):操纵封装新的MAC地址
- TUN 模式:在原请求IP报文之外新加—个IP首部
2 LVS 由哪几部分组成
LVS 由 2 部分程序组成,包括 ipvs 和 ipvsadm。
- ipvs (ip virtual server):一段代码工作在内核空间,叫ipvs,是真正生效实现调度的代码;
- ipvsadm:另外一段是工作在用户空间,叫ipvsadm,负责为ipvs内核框架编写规则,定义谁是集群服务,而谁是后端真实的服务器(Real Server)。
3 LVS 相关的术语有哪些
- DS:Director Server,指的是前端负载均衡器节点。
- RS:Real Server,后端真实的工作服务器。
- VIP:Virtual IP,向外部直接面向用户请求,作为用户请求的目标的IP地址。
- DIP:Director Server IP,主要用于和内部主机通讯的IP地址。
- RIP:Real Server IP,后端服务器的IP地址。
- CIP:Client IP,访问客户端的IP地址。
4 LVS 集群的负载调度算法有哪些
- 轮叫(轮询、轮流)调度(Round-Robin Scheduling)rr
- 加权轮叫(轮询)调度(Weighted Round-Robin Scheduling)wrr
- 最小连接调度(Least-Connection Scheduling)lc
- 加权最小连接调度(Weighted Least-Connection Scheduling)wlc(默认调度算法)
- 基于局部性的最少链接(Locality-Based Least Connections Scheduling)lblc
- 带复制的基于局部性最少链接(Locality-Based Least Connections with Replication Scheduling)lblcr
- 目标地址散列调度(Destination Hashing Scheduling)dh
- 源地址散列调度(Source Hashing Scheduling)sh
5 使用LVS 可不可以把iptables给禁用删除
可以,禁用iptables并不会影响LVS的使用。LVS是在Linux内核层面实现的负载均衡技术,其底层并不依赖于iptables进行流量转发。LVS使用IP隧道或网络地址转换(NAT)等技术将来自客户端的流量转发到后端服务器上,而不依赖于iptables规则。
6 haproxy 调度算法有哪些
tcp代表四层负载,http代表七层负载。
静态算法:
- static-rr-------->tcp/http:基于权重的轮询调度,不支持运行时利用socat进行权重的动态调整(只支持0和1,不支持其它值及后端服务器慢启动,其后端主机数量没有限制,相当于LVS中的wrr。
- first------------->tcp/http:根据服务器在列表中的位置,自上而下进行调度,但是其只会当第一台服务器的连接数达到上限,新请求才会分配给下一台服务,因此会忽略服务器的权重设置,此方式使用较少。不支持用socat进行动态修改权重,可以设置0和1,可以设置其它值但无效。
动态算法:
- roundrobin------->tcp/http:基于权重的轮询动态调度算法,支持权重的运行时调整,不同于lvs中的rr轮训模式,haproxy中的roundrobin支持慢启动(新加的服务器会逐渐增加转发数),其每个后端backend中最多支持4095个real server,支持对real server权重动态调整,roundrobin为默认调度算法,此算法使用广泛。
- leastconn--------->tcp/http:加权的最少连接的动态,支持权重的运行时调整和慢启动,即:根据当前连接最少的后端服务器而非权重进行优先调度(新客户端连接),比较适合长连接的场景使用,比如:MySQL等场景。
- random------------>tcp/http:在1.9版本开始增加random的负载平衡算法,其基于随机数作为一致性hash的key,随机负载平衡对于大型服务器场或经常添加或删除服务器非常有用,支持weight的动态调整,weight较大的主机有更大概率获取新请求。
其他算法:以下静态和动态取决于hash_type是否consistent
- source---------->tcp/http:源地址hash,基于用户源地址hash并将请求转发到后端服务器,后续同一个源地址请求将被转发至同一个后端web服务器。此方式当后端服务器数据量发生变化时,会导致很多用户的请求转发至新的后端服务器,默认为静态方式,但是可以通过hash-type支持的选项更改。 这个算法一般是在不插入Cookie的TCP模式下使用,也可给拒绝会话cookie的客户提供最好的会话粘性,适用于session会话保持但不支持cookie和缓存的场景。 源地址有两种转发客户端请求到后端服务器的服务器选取计算方式,分别是取模法和一致性hash。
- uri--------------->http:基于对用户请求的URI的左半部分或整个uri做hash,再将hash结果对总权重进行取模后,根据最终结果将请求转发到后端指定服务器,适用于后端是缓存服务器场景,默认是静态算法,也可以通过hash-type指定map-based和consistent,来定义使用取模法还是一致性hash。
- url_param---->http:url_param对用户请求的url中的params部分中的一个参数key对应的value值作hash计算,并由服务器总权重相除以后派发至某挑出的服务器;通常用于追踪用户,以确保来自同一个用户的请求始终发往同一个real server,如果无没key,将按roundrobin算法。
- hdr-------------->http:针对用户每个http头部(header)请求中的指定信息做hash,此处由name指定的http首部将会被取出并做hash计算,然后由服务器总权重取模以后派发至某挑出的服务器,如果无有效值,则会使用默认的轮询调度。
- rdp-cookie---->tcp:rdp-cookie 对windows远程桌面的负载,使用cookie保持会话,默认是静态,也可以通过hash-type指定map-based和consistent,来定义使用取模法还是—致性hash。
各算法使用场景
代码语言:shell复制first # 使用较少
static-rr # 做了session共享的web集群
roundrobin
random
leastconn # 数据库
source # 基于客户端公网IP的会话保持
uri--------->http # 缓存服务器,CDN服务商,蓝汛、百度、阿里云、腾讯
url_param--->http # 可以实现session保持
hdr # 基于客户端请求报文头部做下一步处理
rdp-cookie # 基于windows主机,很少使用
7 nginx 实现负载均衡的分发策略有那些
- 轮询(默认):每个请求按时间顺序逐一分配到不同的后端服务器,如果后端某个服务器宕机,能自动剔除故障系统。
- 权重 weight:weight 的值越大,被访问概率越高,主要用于后端每台服务器性能不均衡的情况下。其次是为在主从的情况下设置不同的权值,达到合理有效的地利用主机资源。
- ip_hash(IP绑定):每个请求按访问IP的哈希结果分配,使来自同一个IP的访客固定访问一台后端服务器,并且可以有效解决动态网页存在的session共享问题
- url_hash(第三方插件):必须安装Nginx的hash软件包,按访问url的hash结果来分配请求,使每个url定向到同一个后端服务器,可以进一步提高后端缓存服务器的效率。
- fair(第三方插件):必须安装upstream_fair模块。对比 weight、ip_hash更加智能的负载均衡算法,fair算法可以根据页面大小和加载时间长短智能地进行负载均衡,响应时间短的优先分配。
8 四层负载和七层负载的区别
- 四层:IP PORT转发
- 七层:协议 内容交换
四层负载:
在四层负载设备中,把client发送的报文目标地址(原来是负载均衡设备的IP地址),根据均衡设备设置的选择web服务器的规则选择对应的web服务器IP地址,这样client就可以直接跟此服务器建立TCP连接并发送数据,而四层负载自身不参与建立连接,而和LVS不同,haproxy是伪四层负载均衡,因为haproxy需要分别和前端客户端及后端服务器建立连接。
七层负载:
七层负载均衡服务器起了一个反向代理服务器的作用,服务器建立一次TCP连接要三次握手,而client要访问Web Server要先与七层负载设备进行三次握手后建立TCP连接,把要访问的报文信息发送给七层负载均衡;然后七层负载均衡再根据设置的均衡规则选择特定的Web Server,然后通过三次握手与此台Web Server建立TCP连接,然后Web Server把需要的数据发送给七层负载均衡设备,负载均衡设备再把数据发送给client;所以,七层负载均衡设备起到了代理服务器的作用,七层代理需要和Client和后端服务器分别建立连接。
简单说:4层是修改用户请求的目标路由直接转发到服务器;7层是把用户的报文拆分开,由负载均衡替代用户发送到服务端。同样的返回报文的时候先发给负载均衡器,然后负载均衡修改报文后再发给用户。所以我们看到的日志的用户ip是负载均衡器的ip地址,因此需要做ip透传x-forward。
9 负载均衡的作用有哪些
- 转发功能:按照一定的算法【权重、轮询】,将客户端请求转发到不同应用服务器上,减轻单个服务器压力,提高系统并发量。
- 故障移除:通过心跳检测的方式,判断应用服务器当前是否可以正常工作,如果服务器期宕掉,自动将请求发送到其他应用服务器。
- 恢复添加:如检测到发生故障的应用服务器恢复工作,自动将其添加到处理用户请求队伍中。
10 LVS、HAProxy、Nginx三款负载均衡的优缺点及区别
LVS 的优点:
- 抗负载能力强、工作在第4层仅作分发之用,没有流量的产生,这个特点也决定了它在负载均衡软件里的性能最强的;无流量,同时保证了均衡器IO的性能不会受到大流量的影响;
- 工作稳定,自身有完整的双机热备方案,如LVS Keepalived和LVS Heartbeat;
- 应用范围比较广,可以对所有应用做负载均衡;
- 配置性比较低,这是一个缺点也是一个优点,因为没有可太多配置的东西,所以并不需要太多接触,大大减少了人为出错的几率;
LVS的缺点:
- 软件本身不支持正则处理,不能做动静分离,这就凸显了Nginx/HAProxy Keepalived的优势。
- 如果网站应用比较庞大,LVS/DR Keepalived就比较复杂了,特别是后面有Windows Server应用的机器,实施及配置还有维护过程就比较麻烦,相对而言,Nginx/HAProxy Keepalived就简单多了。
Nginx的优点:
- 工作在OSI第7层,可以针对http应用做一些分流的策略。比如针对域名、目录结构。它的正则比HAProxy更为强大和灵活;
- Nginx对网络的依赖非常小,理论上能ping通就就能进行负载功能,这个也是它的优势所在;
- Nginx安装和配置比较简单,测试起来比较方便;
- 可以承担高的负载压力且稳定,一般能支撑超过几万次的并发量;
- Nginx可以通过端口检测到服务器内部的故障,比如根据服务器处理网页返回的状态码、超时等等,并且会把返回错误的请求重新提交到另一个节点;
- Nginx不仅仅是一款优秀的负载均衡器/反向代理软件,它同时也是功能强大的Web应用服务器。LNMP现在也是非常流行的web环境,大有和LAMP环境分庭抗礼之势,Nginx在处理静态页面、特别是抗高并发方面相对apache有优势;
- Nginx现在作为Web反向加速缓存越来越成熟了,速度比传统的Squid服务器更快,有需求的朋友可以考虑用其作为反向代理加速器;
Nginx的缺点:
- Nginx不支持url来检测。
- Nginx仅能支持http和Email,这个它的弱势。
- Nginx的Session的保持,Cookie的引导能力相对欠缺。
HAProxy的优点:
- HAProxy是支持虚拟主机的,可以工作在4、7层(支持多网段);
- 能够补充Nginx的一些缺点比如Session的保持,Cookie的引导等工作;
- 支持url检测后端的服务器;
- 它跟LVS一样,本身仅仅就只是一款负载均衡软件;单纯从效率上来讲HAProxy更会比Nginx有更出色的负载均衡速度,在并发处理上也是优于Nginx的;
- HAProxy可以对Mysql读进行负载均衡,对后端的MySQL节点进行检测和负载均衡,不过在后端的MySQL slaves数量超过10台时性能不如LVS;
- HAProxy的算法较多,达到8种;
LVS:是基于四层的转发
HAproxy:是基于四层和七层的转发,是专业的代理服务器
Nginx:是WEB服务器,缓存服务器,又是反向代理服务器,可以做七层的转发
区别:LVS由于是基于四层的转发所以只能做端口的转发,而基于URL的、基于目录的这种转发LVS就做不了
工作选择:HAproxy和Nginx由于可以做七层的转发,所以URL和目录的转发都可以做,在很大并发量的时候我们就要选择LVS,像中小型公司的话并发量没那么大,选择HAproxy或者Nginx足已,由于HAproxy由是专业的代理服务器,配置简单,所以中小型企业推荐使用HAproxy
关于我
全网可搜《阿贤Linux》
公众号:阿贤Linux
个人博客:blog.waluna.top
https://blog.waluna.top/
原文链接: Linux运维工程师面试题(3).