就像曾经离经叛道的青年,最终也可以成为纵横硅谷的互联网巨擘一样。在超级计算机领域,曾经心有旁骛的“不正经”尝试,在今天却成了中国超算“多元化”的铺路石。
“学术界和媒体过去有些非议,认为国内的超算并不是正经做超算的。”廖湘科院士说,“它还在做着互联网或者别的什么……”
廖湘科是中国工程院院士,现任国防科大计算机学院院长。他是著名的“天河一号”和“天河二号”总设计师。
当他在“2018联想超算全球峰会”中谈及这一曾经让人尴尬的话题时,那些“不正经”的尝试,却已让中国超算于全球超算“多元化”的潮流中,走到了“比较领先”的位置。
事实上,有鉴于大数据和AI的无限风光,中国的超级计算正在迎接一个“超正经”的未来。
中国工程院院士、 “天河一号”和“天河二号”总设计师、国防科大计算机学院院长 廖湘科
卢宇彤曾面对过那种非议。作为国家超级计算广州中心主任,她同样头顶着“一代银河、两代天河”建设者的光环。
3年前,国家超算广州中心开始讨论在天河二号上尝试高性能和大数据融合服务的时候(当时还没有涉足AI),经常参与国际学术对话的卢宇彤就常常听到国外同行类似的疑问——欧美超算中心只解决IaaS问题,“你们为何还要去解决其他各种各样的问题?”
如今,这些所谓“各种各样的问题”在卢宇彤看来都指向了同一个目标——降低应用门槛。
“只有应用群体扩大了,技术的演进才能进入一个良性的循环中。”她说。
国家超级计算广州中心主任 卢宇彤
2017年底,国家超算广州中心发布了“天河星光”云超算平台2.0——一个支持科学计算、大数据和AI的融合平台。
这个按需定制的虚拟化平台让普通用户可以借云计算的模式使用超级计算机。在过去的很长一段时间,它们大多被摆放在国家级的实验室里,服务于科学和工程计算。
截止“天河星光2.0”发布时的数据,“天河二号”上已经部署了700多个应用软件和工具软件,用户总数超过2500家——使其成为全球用户数量最多的超级计算系统之一。
这是应用和系统间的桥梁,卢宇彤说,“联想也在做这件事,我们很高兴看到(这一点),只有让更多的用户用起来,才有中国超算系统和应用的技术提升。”
她指的是联想的智能超算管理平台LiCO,它可以支持在同一个集群上的HPC和AI应用。
在这次2018全球超算峰会上,联想推出了一个新的LiCO GENE Edition版本,这个版本在整合了人脸识别、深度学习和自然语言等应用的基础上进一步融合了基因(Gene)探索。
“LiCO是联想AI战略的典型代表。”Madhu Matta是联想集团副总裁、高性能计算及人工智能事业部总经理,他说,行业中大部分的企业对AI仍是一头雾水。现阶段,供应商需要以“端到端的人工智能解决方案”来帮助用户实现在AI领域的长远发展。
联想集团副总裁、高性能计算及人工智能事业部总经理 Madhu Matta
长城汽车是国内较早从仿真研发开始接触高性能计算的自主汽车厂商。长城汽车IT管理本部系统科负责人林海鑫早年便经历过,问遍高性能计算硬件、软件和中间件厂商却最终对HPC建设无从下手的窘境。
“现在的用户只需要面对联想,我们已经替用户把所有的工作都做了。”Madhu Matta说,包括深度学习解决方案在内的AI和大数据技术架构都已经成熟,合作伙伴也已经做好了准备。他不失时机地向听众推销说:“他们随时可以向你销售这些技术架构。”
林海鑫说,正是考虑到体系的完整性,从2014年建成的第一套集群,到此后的二期、三期升级,长城汽车都选择了联想提供的解决方案;并最终以此支撑起了现在长城汽车智慧的产品、智慧的研发,和智慧的制造,涵盖了长城汽车所有的热销车型。
系统平台的存在,尤其是端到端解决方案的存在,让用户特别是缺少超算经验的企业用户可以更容易地使用超算。
现在,全球HPC TOP500中的超级计算机中已经有超过一半正服务于企业用户。在最新的TOP500榜单中,联想入围117套,是榜单中全球最大的HPC解决方案供应商。
“厂商的份额代表了技术水平和质量可信度。”中国TOP100发起人、软件行业协会数学软件分会常务副理事长袁国兴教授说。
调研公司Hyperion Research此前预计,从2017年到2022年,全球超级计算机市场将翻一番,增长至约590亿元人民币。
在中国市场,庞大的互联网托起了AI应用的勃兴,再加上庞大的制造业对数字化的渴望等,这一切让“中国超算市场的(新)需求比他们(欧美)要多,用户群体也更广泛”,卢宇彤说,“最终,我们做实验的机会也将比他们多。”
“现在看来,中国超算的多元化应用,是在世界超算领域开了一个比较好的头。”廖湘科在演讲中评价说。
这是中国超算应该抓住的发展机遇。现在,它需要面对的问题是高性能计算、大数据和AI能在多大程度上展开融合。
从高性能计算的视角看,这种融合的必要性源自自身技术演进的市场动因。
无论对于政府还是企业,超算都意味着一个巨大的投入。“这个巨大的投入必须拥抱一个巨大的市场才能获得回报,也才能支持其持续发展。”廖湘科认为,在这一点上,超算获得发展的基础正是拥抱新的需求——在计算科学的基础上,拥抱数据科学,拥抱智能科学。
作为“拥抱”的最新落地,联想在其全球超算峰会上正式发布了自主研发的AI产品家族。
除LiCO GENE Edition外,联想发布了为HPC和AI优化的全新人工智能服务器Think System SR670、Think System HG680,和Think System HG690。
同期,联想还推出了其第三代温水水冷解决方案“海王星”系统。联想称,借助Direct-to-Node温水水冷技术、后门热交换器、以及由空气和液体冷却组成的混合冷却技术,该系统可以使数据中心的运行效率提升高达50%.
此前,北京大学高性能计算校级公共平台“未名一号”,采用联想深腾X8800超级计算机系统,已经帮助联想完成了首个45℃温水水冷超算中心的中国首秀。
该HPC集群计算力高达1000万亿次,为“未名一号”节省了50%的制冷散热成本,每年为北京大学节省用电60万度。
目前在科研领域,全国68所985高校中,有49所高校正采用联想的HPC和AI解决方案进行教学、科研;同时,在全球25所依托高性能计算开展科研的顶级大学中,有17所正运行着联想的HPC和AI解决方案。
“我们现在既要重视高性能计算对大数据、人工智能的支撑作用,也要重视人工智能和大数据的发展,对于高性能计算的促进和推动的作用。”钱德沛教授是国家863、973计划重大专项组组长,他提醒听众——联想在会场聚集了中国超算领域的多位顶级专家(例如文中提到的那些科学家们)和众多高端用户、合作伙伴——建立国产高性能计算机的生态系统将是一个非常紧迫的问题。
联想作出了尝试。事实上,除了软硬件产品方案业已取得的市场成绩,这是一个联想在高性能计算和AI领域值得称道的努力:
在硬件层面,联想正在加深与Intel、NVIDIA、Mellanox等厂商的合作关系;
在软件层面,联想主动开放了生态系统,以吸引主流软件厂商加入联盟;
围绕应用层,联想创投投资了Face 、银河水滴科技等有潜力的科技创新公司,这些公司在最新的AI应用如人脸识别领域已经走在了市场的前端。
这些努力让超算圈打造“HPC AI完整生态圈”的目标,最终有了实现可能——现在,人们已经可以期待一个“超级正经”的、超算的未来。
- END -
【IT创事记】创见科技未来,旨在为读者提供科技企业和科技趋势的前瞻分析与评论。创始人祁萌,为资深科技自媒体人,曾任《商业伙伴》副总编、《电脑商报》主编、都市媒体记者编辑,从业超过14年。
【IT创事记】同名专栏入驻各主流媒体平台。