#数字中国万里行# 云数据中心导向IT技术架构变革

2022-06-16 21:08:06 浏览数 (1)


(本文作者雷锋网张帅)小编近日跟随数字中国万里行团队探访了国内多家技术较为先进的大型数据中心,包括天津腾讯云数据中心,字节跳动数据中心,张北阿里云数据中心集群等,实地勘察超大规模云数据中心更能体会到一个事实——IT市场正经历洗牌过程,服务器厂商格局的变化业已发生。

Gartner数据显示,2017年,戴尔、HPE、浪潮分列前三,最高增速是浪潮的50.1%。2018年Q1全球服务器增长17.5%,DELL、HPE和浪潮分列前三,不过浪潮出货量同比增长43.9%,其它厂商的最高增速没有接近20%的。

IT架构从通用走向专用

Uptime Institute发布的《2018数据中心调查报告》显示,2018年全球数据中心PUE平均为1.58,而雷锋网本次造访的数据中心PUE大都在1.3以下,有些甚至达到了1.2左右。从这些较为先进的云数据中心层层堆叠、幢幢排列的服务器雷锋网发现,IT技术架构正从通用走向专用。

数据中心的发展经历大集中(Data Center Consolidation)为主的1.0时代、利用资源虚拟化(Virtualization)和服务动态管理(Dynamic Service Orchestration)技术增加资源共享利用率和资源部署灵活度的2.0时代,随着云计算技术的日趋成熟和大批量部署,3.0时代更偏重于大规模互联网业务需求,服务器从均衡设计走向场景化极致设计,数据中心建造主体有向大型互联网公司和中立第三方倾斜的趋势。

视频内容

从当下最火的AI服务器市场来看,IDC报告显示,2017年中国AI服务器整体销售额5.68亿美元,出货量27863台。硬件系统占AI整体市场花销达到72.4%,2017年AI硬件销售额同比增长235%,预计2022年市场容量将达37.7亿美元,其中GPU服务器采购将达34亿美元,占整体x86服务器市场的16.6%。

当然了,很多互联网企业都是AI服务器的购买大户,浪潮服务器也多次出现在各大企业新建的数据中心内。IDC报告中,浪潮AI服务器市场份额市场第一,出货量达到14674台,销售额达3.24亿美元,占比分别为52.7%和57%,超过其他厂商份额的总和,我们也多次在数据中心见到了浪潮的M5系列服务器,该服务器的特性就诠释了厂商对AI服务器的诉求。

“数字中国万里行”途经怀来字节跳动数据中心

浪潮NF5288M5并没有采用传统异构计算架构模式,而是在2U空间内部署8块NVLink或PCI-E 接口的NVIDIA® Tesla® P100 GPU,不依赖CPU实现机内点到点通讯,减少异构通讯次数,也减少异构导致的效率降低损失。

灵活性也是必备要素,NF5288M5具备拓扑的灵活性可支持NVIDIA NVLink和PCIe两种GPU互联方案,采用NVIDIA NVLink时可提供GPU间高带宽低延迟互联,以及高达300GB/s的吞吐量,而Geforce1080 基于PCIE3带宽仅为16GB/s。在某客户的人脸识别线下训练场景中,浪潮提供的NF5288M5 V100平台,通过性能优化实现比Geforce 1080Ti接近4倍的训练速度提升。

总结一下,当下AI服务器的普遍具备要素包括更高效率(异构变同构等),高密度架构、灵活计算拓扑等,除了AI服务器,还有专门用于存储、计算的服务器也各有优势,已经在云数据中心大量应用,这是以往“一招鲜”的通用统一标准服务器难以做到的。

云数据中心意味着技术架构由集中式转向分布式,服务器数量增多,进而推动了超大规模数据中心的市场占比。云数据中心对服务器的需求一般包括:高密度、低功耗、大内存、强散热、智能运维等,支撑着移动社交、电子商务、游戏等业务,为大家耳熟能详的Google、Facebook、百度、阿里、腾讯等建设了庞大的云计算数据中心。

IDC预计,全球云IT基础架构产品销售额将保持11%的年复合增长率,到2020年将超过非云IT基础架构的支出。上述大型互联网厂商的共通点是——自身即为拥有海量业务需求的互联网运营商,云数据中心是支撑自身业务发展的必要条件,同时也是大型云计算运营商,对内云计算能力对外输出同样离不开数据中心的依托。

整机柜服务器成最小颗粒

如前所述,通过参观几家较为先进的数据中心,高度集成、模块化、面向应用的设备定制化——已经成为新的数据中心采购服务器的标准,实际上,整机柜服务器正成为互联网厂商采购对象。

模块化已经是业界普遍认可的趋势,腾讯的第四代数据中心技术T-block将被应用于贵安七星数据中心内,存储腾讯最重要的数据,阿里采用模块化设计的雷神服务器已经商用,华为的模块化数据中心技术也一直在开展,诸如此类,需求端决定了模块化越来越受到市场青睐。

中国联通呼和浩特云数据中心

整机柜服务器本质成为一个数据中心颗粒,而不是传统的计算设备,集成了计算、网络、存储以及散热、供电、管理等模块,具有完备的数据中心功能,而且一体化设计、一体化部署,部署密度提升1-3倍,能源效率在90%以上。

相比之下更大的提升是部署速度,传统机架式设备的日部署量约为几百台,而整机柜的日部署量能达到几千台,浪潮整机柜服务器SR在百度阳泉数据中心创下了1万节点/日的部署速度。比如一个年采购量为15万台的Tier1 CSP,平均每日就要部署400多台,在实际工作中日部署量都在2000台以上,这样的部署速度是机架式设备很难满足的。

说到整机柜服务器的产业化,实际上离不开浪潮这一类供应商在开放计算组织的推动。开放计算组织共有ODCC、OCP和OPEN19三家,开放计算组织的核心目的是构筑基于新标准的产业生态,供应商可以完善技术开发,提高技术可行性;另外还能协同产业上下游做好产业配套,缩短产品落地时间。

浪潮是唯一一家同时加入ODCC、OCP、Open19全球三大开放计算组织的服务器供应商,2010年浪潮研制的第一台整机柜服务器SR 1.0,天蝎组织(ODCC的前身)尚未成立。浪潮SR整机柜服务器很大程度上影响了天蝎标准的制定,背部无线缆风扇墙以及机柜管理模块RM集成到电源等很多设计思路直接被天蝎标准采用,并延用至今。2017年,浪潮加入了OCP,成为其铂金会员,发布了符合OCP国际标准的OR系列整机柜服务器,10月,由浪潮研发的ON5263M5服务器正式通过OCP的认证,是OCP社区首款基于Intel Skylake平台的服务器,同年,浪潮也成为OPEN19的创始会员,全球最先发布了符合OPEN19标准的服务器。

早在2012年亚马逊就有约1万个整机柜采购量,国内市场也对整机柜服务器热情不减,2009年浪潮就开始在国内率先研究整机柜服务器方案,2012年百度开始与浪潮联合开发并批量应用整机柜服务器SR,2017年百度和浪潮还共同发布了业界最高GPU密度的SR-AI整机柜。据了解,浪潮SR整机柜已经迭代到4.5,中国市场占有率超过60%。

技术在蜿蜒迭代中上升,“通用”服务器的概念也在不同以往,如今的通用服务器意味着统一的平台支持弹性配置,灵活满足多样化应用场景。浪潮NF5280M5在通用的平台架构基础上,实现存储、IO、异构模块随需搭配,这是服务器发展另一个方向。

中国信息通信研究院云计算与大数据所所长何宝宏曾表示,数据中心产业正在迎来它的"黄金十年",未来数据中心必须是软件定义的,必须模块化、开放以及标准化。与之紧密相关的服务器厂商都在未雨绸缪争夺前三的位置,而抓住互联网行业就意味着抓住了这张“诺亚方舟票”。(本文作者雷锋网张帅)

- END -

【IT创事记】创见科技未来,旨在为读者提供科技企业和科技趋势的前瞻分析与评论。创始人祁萌,为资深科技自媒体人,曾任《商业伙伴》副总编、《电脑商报》主编、都市媒体记者编辑,从业超过14年。

【IT创事记】同名专栏入驻各主流媒体平台。


0 人点赞