联想HPC开启中国与全球第一“巡航模式”

2022-06-28 14:02:31 浏览数 (2)

本月备受瞩目的HPC TOP100榜单发布中,联想以39套的成绩名列榜首,第五次获得中国第一。

时隔近一周,TOP500组织发布了最新的全球超级计算机TOP500榜单。榜单显示,在全球浮点运算性能最强的500台超级计算机中,联想制造的超算入围175台,数量远超其他厂商,再次名列全球高性能计算提供商份额第一名。

联想HPC在中国和全球市场的这些表现,仿佛开启了“第一巡航”模式,遇强愈强。不过,注意到联想HPC业务演进时仍能发现,这些持续不断的“第一”看似轻松,实则不易。

联想HPC自1999年团队成立至今,经历了20年的发展历程。2014年之前,联想HPC从无到有,从弱到强。首席科学家祝明发、肖利民等知名HPC专家在此期间为联想培养起了一支强大的HPC团队和健全的人才体系。

此后至2017年,借助并购IBM x86服务器的契机,联想HPC开始走向国际,并迅速在产品和方案创新,以及人才国际化方面取得突破。此时,联想已开启了持续多年的第一模式。

2017年之后,随着AI对HPC用户的影响开始显现,联想HPC也进入了HPC与AI融合的新阶段并发展至今。

这一融合进程在2019年初达到了一个小高潮——联想将3S战略正式推向前台,它明确了联想转型所聚焦的三大战略领域——智能物联网(Smart IoT)、智能基础架构(Smart Infrastructure)和行业智能(Smart Verticals)。

在此之前,联想在AI领域的成绩只在一些偏“高端”的企业级产品及解决方案中显露过,并不广泛被外人所知。因此乍看起来,这种面向智能的全维度转型就像一夜之间突然遍布在了联想的每一个角落。

但联想为此转型而进行的布局远比人们看到的要早上许多。至少在三年前,一批人工智能领域的世界级专家就已经在联想组建起了人工智能实验室,其中就包括了芮勇博士和徐飞玉博士,两人当时分别由微软和德国人工智能实验室进入联想。

联想研究院人工智能实验室主任研究员 王奇刚

“我们在AI的各个领域都做了很多研究。”王奇刚说,这些研究中的一部分基于和HPC部门的合作,涉及领域包括了算法和算力等。王奇刚是联想研究院人工智能实验室主任研究员。

两年后,这些努力在2018年世界超算大会(ISC 2018)上大放异彩——联想的智能超算平台LiCO平台获得了美国HPC权威媒体HPC wire评选的“最佳AI产品技术奖”。

紧随其后,研究全球人工智能技术和产品市场的市场情报权威机构Tensorflow也将“最佳AI平台”奖颁给了它。评委们从全球15个国家的2500多种解决方案中选中了联想LiCO。

在AI高速勃兴的时代,这个最初为帮助用户快捷建设高性能计算集群的管理平台最终以AI闻名于全球——同时也成了今年联想3S战略汇聚成型的一块重要基石与典型代表。HPC用户在AI领域展开探索时,可以通过它直接获得一个成熟的端到端的人工智能解决方案。

今年年中发布的新一代融合计算平台深腾X9000搭载了它的最新版本LiCO 5.3。这一版本让深腾X9000可以在一个集群中支持HPC和AI作业的统一资源调度。

联想数据中心业务集团HPC & AI营销总监 于涛

联想数据中心业务集团HPC & AI营销总监于涛说,以此为更多的企业客户赋能,正是联想在HPC与AI融合进程中采取的重要策略。

这种融合是多维的。技术上的融合让用户可以在多种智慧行业场景中直接利用基本的AI能力,例如AR/VR、分布式训练、人脸识别、语义识别等;行业的融合与生态的融合则让深腾X9000拥有了更广阔的舞台。

还有一种融合是向下的。作为产业中“皇冠上的明珠”,HPC引领的技术趋势已经明显影响到了传统数据中心的构建。

“因为温水水冷在性能、功耗和故障率中的表现,越来越多的传统数据中心已经在用水冷技术进行重构。”于涛说。在目前联想与一些大型数据中心的交流中,用户已经将水冷作为一个首先会去考虑方案,“甚至都不仅是考虑冷水,而是直接考虑温水水冷”。

联想是目前国内最重要的温水水冷技术的推动者。联想的数据显示,深腾X9000所搭载的第四代温水水冷技术“海神”,可以让数据中心运行效率提升高达50%。该技术率先采用了50℃的温水水冷技术,和E2E能源转化率,其成熟和领先程度在业内居于前位。

北京大学在国内率先全面采用了联想温水水冷HPC解决方案后,用户对这一技术方案的热情便被点燃。2019年,北京气象局HPC项目以2.4PF计算能力上榜TOP100,其所采用的正是联想深腾X9000以及新一代温水冷却技术。

由于这一项目将服务于2020年冬奥会气象服务保障,其影响力本身也就变得举足轻重了——它将联想最新HPC解决方案和水冷技术的影响力,从高校与科研领域,推向了政府的关键项目中。

目前,联想HPC的用户已经在全球覆盖了科研、教育、气象、大气海洋、石油石化、CAE仿真计算、生命科学、人工智能等多个领域。

其中,全球的高校和科研机构在联想全球HPC业务中占比约30%~35%,同时全球前25所研究型大学中,有约70%运行了联想的HPC解决方案。

全球顶级学府——美国的哈佛大学成为了北美第一个使用联想第四代水冷技术的超算用户。

11月18日,联想联合英特尔正式为美国哈佛大学交付了名为“坎农”的高效能分布式超级计算集群。这台超算以美国著名女性天文学家安妮·詹普·坎农(Annie Jump Cannon)命名,由哈佛大学文理学院计算研究部管理。

“坎农”能为600多家实验室群体和4500多名哈佛研究人员提供支持,帮助他们开展科学、工程、社会科学、公共卫生、教育建模与仿真研究。

同样来自国际市场的最新消息是,联想已凭借综合实力从众多顶级HPC厂商中脱颖而出,一举赢得韩国某大型项目。据悉,该项目建成后峰值计算能力将高达50PF,该系统不仅使用了联想“海神”第四代温水水冷解决方案,还结合了最新的Dragonfly网络结构。

联想透露的信息显示,明年“海神”系统将迎来全新升级,主要升级方向将集中在功耗表现和基于不同场景的异构加速需求等方面。

与联想乐意将温水水冷技术向传统数据中心推广的融合思路相近,联想目前也在探讨如何让客户可以像使用任何通用的HPC平台一样,无缝的切换到Exa-scale的计算平台上。

行业普遍预计2020年之后中国将进入E级超算的时代。有别于针对Exa-scale进行专业化设计的理念,联想主张使用更加通用的部件和更加开放标准的去实现到Exa-scale的跨越。

例如在设计Exa-scale的超算时,有人使用专门设计的机柜,网络拓扑与组件以及专属的供电系统。而联想则更倾向于使用标准的机柜,通用的高带宽低延迟网络,以及标准化的供电模块。

于涛表示,这样做的优势是可以大幅度降低Exa-scale的建设成本,同时也大幅降低客户的应用的难度和门槛。“让用户不需要做迁移和切换就能实现应用,这也符合了联想的产品策略方向。

0 人点赞