9月25日,2021中国智能网卡研讨会在北京隆重召开。本届大会由“科创中国”未来网络专业科技服务团指导,江苏省未来网络创新研究院、网络通信与安全紫金山实验室联合主办,SDNLAB社区承办。中国移动研究院数据中心网络项目经理王瑞雪女士带来了演讲“运营商智能网卡部署场景探索及思考”。
王瑞雪谈到,虚拟化技术演进经历了虚拟化、资源池云化、软硬协同虚拟化三个阶段。单服务器虚拟化是在虚机实现单服务器内物理资源的共享、逻辑资源的隔离,但也存在很多问题,例如无法跨节点共享、无法弹性伸缩等等。资源池云化实现了资源池内计算/存储/网络资源全面云化,能够统一调度,实现整个资源池的共享。然而,随着资源池规模不断扩大,虚拟化的消耗也越来越大,软件、CPU处理瓶颈逐渐显露,虚拟化技术正逐步向高算力IDC、多云/混合云演进。
王瑞雪指出,虚拟化损耗是我们迫切需要解决的问题,如何降低虚拟化本身带来的损耗来提升服务器的性能、业务性能将成为后续整个运营商数据中心演进的趋势。
应用激增使得数据中心流量以每年25%速度增长,网络向高带宽和新型传输体系发展,网络堆栈处理越发复杂;后摩尔定律时代,CPU 计算能力增速低于网络传输速率增速,且差距持续增大,将网络功能卸载到可编程硬件的需求愈发急迫。
受市场需求的强驱动,在服务器侧引入智能网卡,将网络、存储、操作系统中不合适CPU处理的高性能数据处理功能卸载到硬件芯片执行,提升数据处理能力,释放CPU算力。
王瑞雪介绍,智能网卡主要有五大应用场景:1)网络、存储等功能卸载,释放可用CPU资源,提高对外服务能力,增产增收;2)DPDK、SPDK和RDMA等技术集成实现业务加速、提升服务器性能;3)针对特定业务逻辑进行硬件加速;4)解决裸金属存储网络的安全隐患,存储网络信息不再暴露给到用户权限界面之内,从而解决原有安全隐患;5)业务端到端网络可视化,将观察点从硬件交换机延伸到主机侧,实现网络端到端网络运维可视化。
目前业内主流网卡分为四类:1)SOC是通过CPU上做业务功能加速,更适合业务初期,网络业务需求不是完全固定,这个过程中可编程和灵活性会更强一点。2)NP现在用的比较少,后续可能不是智能网卡主流的演进趋势。3)目前用的比较多的是FPGA CPU,可编程、灵活性比较高,时延和功耗适中。4)ASIC芯片性能高,功耗低,成本也比较低,但灵活性也比较差,适合用在需求相对比较明确的时候,用ASIC来降低成本和功耗。
王瑞雪表示,5G的引入带来了边缘计算的蓬勃发展,运营商网络正在从自动化向智能化演进,从聚焦业务快速发放向数据高效处理、网络高效运维转变。
运营商网络引入智能网卡,一是可以实现网络功能卸载。中国移动IT云和网络云均采用混合SDN方案,面向不同业务提供虚拟机或裸机部署能力,面向虚拟化场景,引入智能网卡突破提升vSwitch转发性能和数据处理能力;面向裸机场景,引入智能网卡构建弹性裸金属服务。
二是存储功能卸载。包括云盘挂载卸载和高性能存储协议卸载,可提高存储访问灵活性、安全性,以及面向边缘视频加速、CDN等场景释放CPU算力,构建端到端低时延网络。
三是运维能力卸载,满足业务网络端到端可视化的需求。
四是业务功能卸载,满足高性能网元虚拟化的需求。UPF虚拟化采用智能网卡加速业务处理,已成为业内主流方案。
运营商网络引入智能网卡同样也面临着挑战,主要有两点:首先是标准化。运营商网络功能都是标准化的,而智能网卡的标准化还不够成熟。目前仅OVS转发面卸载,面临很强的解耦压力,还不能称为真正意义上的解耦。多云多业务场景需适配不用类型智能网卡,随着逐步引入存储功能卸载、业务功能卸载、运维功能卸载后,会迎来越来越多的异厂家、异构智能网卡及解耦场景。后续如何实现解耦标准化工作,是后续运营商落地智能网卡的关注点。
再就是如何进行集成度、灵活性、可靠性取舍。如果将多个业务放在一张网卡上,实现高集成度、低成本,就有可能出现单网卡端口密度高、单网卡故障影响范围大的后果,影响运营商网络的高可靠和安全性。
王瑞雪表示,运营商引入智能网卡,将考虑其演进方向,为多业务场景提供灵活的功能,并将测试相关技术规范,助推智能网卡产业发展。