问鼎高性能云计算之王?中国高性能云计算创新大赛见分晓丨科技云·视角

2022-04-14 18:59:09 浏览数 (1)

“Show出你的野蛮性能”并不是一句漂亮的空话,高性能云计算的实力正在被6大知名云服务商和20多所高校队伍同步验证,谁才是真正的CPU/GPU云主机之王?

3月11日,首届“中国高性能云计算创新大赛”(以下简称“大赛”)现场赛正式落下帷幕。大赛由中国信息通信研究院和中国计算机学会高性能计算专业委员会共同举办。

本次大赛分别面向云计算服务商和科研机构设计了CPU云主机和GPU云主机的性能测试赛程。参赛阵容非常强大,吸引了国内多家知名的云计算服务商及顶尖的科研机构和企事业单位共同参与。

加入战队的云计算服务商有阿里云、华为云、腾讯云、天翼云、UCloud和百度云,参与应用场景测试初赛的有清华大学、北京大学、北京邮电大学、北京工业大学、北京林业大学、北京交通大学等20多所高校。

经过严格的参赛方案评选以及一个月的实测阶段,最终进入现场赛答辩的高校队伍共有4支,他们分别来自北京林业大学、北京交通大学、清华大学和兰州大学。值得一提的是,还有一名来自知名IT厂商的资深工程师以个人名义参赛,最终也进入到决赛答辩环节。

现场赛回顾:

应用场景多样化,水平超预期

根据本次大赛规则,由云计算服务商提供CPU和GPU云主机,参赛队伍则提交自己编写设计的应用场景方案,通过在各厂商提供的云主机上运行来检验厂商云主机性能。

其中,CPU云主机在网站应用、视频流媒体、大数据分析、图像分析四个应用场景进行性能测试,GPU云主机在图形渲染、机器学习两个场景进行性能测试。

据了解,此次报名参赛的队伍提交的应用场景方案,基本上覆盖了大赛规定的所有场景,从多个应用场景对各厂商的云主机进行了性能测试。

例如,兰州大学的参赛方案是关于糖尿病受体与药物的分子动力学模拟。方案设计了基于CPU和GPU架构的NAMD分子动力学代码,模拟出GLP-1R蛋白和药物分子相互作用的场景,同时完成GPU下加速性能的测试和比较。通过对测试性能指标的分析,找出云计算平台最佳的CPU-GPU数量配比。

该方案使用了4-8台CPU云主机和1-4台GPU云主机,其中每台CPU云主机核心数在12-48之间,每台GPU云主机有1-8块NVDIA Tesla系列GPU卡,从而进行多个GPU卡的并行测试。由于并行计算的规模较大,测试例耗时(完整运行一次测试例耗时)高达96小时。

兰州大学参赛队伍在现场赛中答辩

清华大学的参赛方案是对海量文档进行主题模型分类,使用隐式狄利克雷算法(LDA),将稀疏求解的算法应用在GPU上,以达到比CPU更快的求解速度。该方案使用了1台CPU云主机和1台GPU云主机,测试例耗时约为30个小时。

北京林业大学的参赛方案则是基于TensorFlow搭建卷积神经网络,结合GPU高性能计算特点,实现人群计数。该方案使用了1台CPU云主机和2台GPU云主机,通过测试对比发现,在GPU上训练迭代一次所需时间小于1秒,在CPU上训练迭代一次所需时间约为9分钟,GPU可大幅提升训练性能。

据主办方介绍,此次参赛队伍整体水平之高超出预期,其中部分项目已申请成为国家重点项目暂时无法对外公开信息,也有的项目具备在实际应用落地的实力,因而也备受各厂商的瞩目,有望在比赛之后继续推动云服务商和科研机构之间的合作。

让强者更强:

产学研深度结合,赛事创新

事实上,高性能计算赛事并不少见,为何此次中国高性能云计算创新大赛一推出,就有如此多知名厂商和科研机构的踊跃参与,并收获了高质量的参赛成果?不妨看看此次大赛与众不同的地方。

首先,参赛的云服务商和科研机构双向选择。换句话说,云服务商与信通院一起筛选出院校的优秀案例,是优中选优,云服务商只对看中的参赛方案提供云主机的资源支持。

同样,科研机构也会主动选择自身认可的品牌云主机进行测试。这对于云服务商和科研机构双方来说,都是一种挑战,无形中拉高了竞争的门槛。

第二,信通院标准化测试例与高校案例同步测试同步测试。信通院根据《可信云服务评估方法 第1部分:云主机》、《可信云服务评估方法 第15部分:GPU云服务》对云主机进行性能测试。

与此同时向高校征集可在云主机上运行的测试例形式,高校参赛队伍将选取的测试例部署到各厂商提供的云主机,执行委员会通过测试例运行情况来评估各厂家云主机性能。行业标准评估和实际应用案例测试并行,保证了云主机评测的权威性。

第三,实现产学研真正结合。目前大多数高性能大赛主要是某个服务商自己举办的商业化比赛,而此次大赛由服务商、科研机构和信通院三者共同参与。

一方面实现了更大范围的人员参与,另一方面高校队伍对以实际案例测试多家品牌云主机,同时云服务商提供大力的资源支持,可以说是产业力量和高校力量的深度结合。

这也是为什么,最终获奖队伍的优秀方案,可能入选中国信息通信研究院CPU/GPU云主机benchmark测试例集的原因。

据悉,本次大赛邀请了领域内的多位专家领导组成大赛评委会。经组委会讨论,制定了细致、专业的比赛评审规则。

最终赛事结果将于3月22日在“2018云计算开源产业大会”公布,并在现场进行颁奖。面向科研院校和企事业单位人员,将产生优秀应用场景奖。面向云计算厂商及从业人员,将产生每个优秀应用场景测试的性能MAXP奖。

此次参赛的云服务商和高校人员展示出非常高的专业水平,赛事的创新也为业内带来了不一样的惊喜。期待产学研进一步加强合作,不断壮大我国云计算领域高精尖人才队伍的规模,推动国内高性能计算的发展。

【科技云报道原创】

转载请注明“科技云报道”并附本文链接

0 人点赞