网络拥堵甚至中断是互联网业务需要面对的难题。腾讯云基于“IP发布控制 云内骨干网 BGP互联”实现的跨地域网络调度,半年累计已帮助用户屏蔽6960分钟运营商故障。
目前,腾讯云已推出公网流量调度、IP/LB跨地域绑定等能力。11月22日,腾讯云正式推出Supermind智能网络,在国内公有云服务商中率先推出网络传输加速的能力,全面帮助客户优化网络和提升跨地域服务能力,实现体验提升和多地域同服。
那么,这项服务是如何实现的呢?
基本原理——对传输状况恶劣的公网路段进行绕行,就近接收请求
如果客户的流量能走公有云厂商服务节点之间的骨干网来绕开公网拥堵,同时通过控制IP发布对地理距离较远的客户端请求就近接收,用户能得到很大收益:
1) 减少数据包在公网上的传输路径, 避免公网的波动对质量的影响; 2) 公网故障BGP自动切换路由, 在容灾方面天然具有优势; 3) 腾讯骨干网可以提供时延更低,稳定性更高的网络。
基本条件——强大的全球互连互通节点网
网络调度和加速,需要公有云厂商有强大的全球互连互通节点网,和调度控制的能力,才能完成。
腾讯云依托15年的BGP网络运营经验,在面临国内交叉复杂的网络环境中,修炼出一身基于SDN(软件定义网络,Software Defined Network)的跨地域网络调度能力,保障了包括微信、QQ在内的亿万用户良好的互联网通信体验。
具体包括以下几方面:
- Tb级BGP网络出口,35路运营商聚合 所谓巧妇难为无米之炊,没有BGP出口就不要做公有云。腾讯云在全国各个地域拥有Tb级的BGP网络带宽,聚合35路运营商接入资源,保障了即使用户面对微信春节红包这种Tb级入流量的汹涌攻势,也可以从容应对,绝不抖动。
- 全球Tb级骨干承载,实现多节点互连互通 没有连接的BGP网络出口,好像战场上被分割的孤岛,无法相互支援。腾讯云Tb级骨干承载网,连通了腾讯云在全球的各大BGP网络出口,实现单地域故障时可以自动进行流量切换。
- 多维网络监控模型,全局网络监控告警 一方面,腾讯云具备面向全球的网络拨测和自动化告警,从网络层面感知网络运营情况;另一方面,腾讯有大量的自研产品统计上报网络连接质量的统计信息,可以快速定向判断全球网络点对点的网络质量,先于网络层感知网络异常,快速定位问题。
- IP秒级发布和变更的能力 当IP需要更改发布地域时,整个过程秒级发布,业务不间断。
最终实现——全网调度流程
- 驾驭全网的SDN控制器: 腾讯云采用SDN转控分离解决解决方案,将复杂的协议与计算诉求放在上层强大的服务器资源中进行,底层设备仅做转发操作。将路径选择、IP发布的算法统一收归到全局唯一的控制器,能推进简化设备的使用,同时利于控制协议与转发设备的快速迭代创新。控制器与腾讯云的全局网络监控连接,具备全网感知能力,快速发现网络异常,下发对应策略。
- 基于AI的自学习最优路径算法: 传统的BGP选路策略无法适应和支持基于网络通信质量来进行出口优化。SDN控制器的自学习算法,是根据监控反馈的链路质量,通过AI算法计算,以时延和丢包为主要约束条件,支持譬如ISP优先、本地优先、区域优先、AS PATH最短优先等最优出口选择。在几十上百个出口、几万条可选路径的情况下,人工把所有的可能路径遍历研究一遍,可能要几天甚至几个星期来决策。控制器通过神经网络和深度学习来进行处理,在最短时间内计算全局最优的出口,下发路由策略。
- 多维度、精细化控制: 支持流量本地多出口调度或跨DCI调度。后台可支持主机、网段、区域、AS号、运营商等多维度调度配置。
举个例子
某游戏公司,backend服务集群在广州(不希望搞多套逻辑、数据层,降低成本)。但又希望全国的客户能接入。同时需要全局漂移ip,作为访问的唯一入口。可做全局的就近分配、动态流量分配、故障剔除。 在没有网络跨地域调度能力和就近接入服务的能力,用户只能:
- 要区分多个外网IP,每个地域都部署集群,维护多个逻辑层,数据层跨地域读写,一致性和实时性很差;
- 只能寄望运营商链路质量。一旦服务商BGP网络异常,部分地区无法访问。该游戏的用户流失严重;
- DDOS攻击流量集中在一个IP上,影响巨大;
使用腾讯云的方案后,用户实现了 多点接入,全国同服: 用户只用集中维护一套集群,然后IP/LB以跨地域绑定方式,覆盖全国用户,真正意义的全网同服。后续依靠腾讯云就近接收请求的功能,用户能进一步提高业务全国覆盖能力。用户不用感知网络路径的选择,无需手动指定IP发布的位置。腾讯云在合适的地域进行IP发布来达到质量最优。
入口调度躲拥堵:更改IP的发布地,让流量躲开拥堵地区,实现网络效果优化。出方向同样基于原路返回原则,快速响应client端。
路径冗余:腾讯云Tb级骨干承载网,连通了腾讯云在国内的各大BGP网络出口,各个地域互为POP点在单地域故障时可以实现流量切换。
结语
跨地域流量调度和全网加速的出现,体现了国内IAAS公有云厂商的价值体现从IDC内部向全网覆盖,同时体现了网络管理AI化的趋势。因此supermind智能网络的推出是公有云领域的一个里程碑。