当王连平说南方科技大学正“摸着石头过河”时,他指的不是冷冻电镜中心,而是他所负责的科学与工程计算中心。
南方科技大学计算中心主任 王连平
南科大冷冻电镜中心在2018年11月揭牌。英国科学家Richard Henderson在当天参与活动时说,那是全球最大的三个冷冻电镜中心之一,未来的研究能力将会达到全球的前5%。
Henderson是冷冻电镜技术的开创者之一。他在2017年因此同瑞士和美国的两位科学家一起,获得了诺贝尔化学奖。
南科大2012年建校,在泰晤士高等教育(THE) 2019世界大学排榜榜中,综合排名中国内地高校第八;在“50年以下的年轻大学榜”中国内地高校排名中,位列第一。
作为南方科技大学计算中心主任,王连平在2019联想全球超算峰会上大谈冷冻电镜,并不让高校的同行意外。
联想在峰会上发布了全新的融合计算平台深腾X9000
2013年以来,冷冻电镜技术对于生命科学、材料科学研究的影响,就像人们熟知的人工智能对科技生活的影响一样巨大——这项技术让人类可以直接观察到生物大分子的精细结构。
冷冻电镜涉及三个关键因素:冷冻固定技术,显微技术,以及对图像数据进行收集和处理的技术,高性能计算平台是实现冷冻电镜所需海量数据存储和处理的重要基础。而后者是王连平工作中的一项重心。
南科大目前为世界HPC TOP500榜单贡献了两台超算设备。最新的一套“太乙”在今年6月的世界排名中位列第170名,它和南科大另一个GPU平台同由联想提供。
2018年初,北京大学与联想合作,搭建完成了国内首个温水水冷高性能计算平台“未名一号”。之后,北京大学又选择继续与联想合作,同样部署了一个冷冻电镜超算平台。
冷冻电镜对联想HPC的“偏好”与联想硬件平台的性能、功耗等关健特性紧密相关。例如因为温水水冷技术的应用,“未名一号”每年直接为北京大学省电约60万度。
另一个强大的吸引力是软件。基于联想智能超算平台LiCO的开源结构,联想在2018年推出了一个LiCO GENE Edition专业版本,这个版本进一步整合了人脸识别、深度学习和自然语言等AI应用。
“我们把与冷冻电镜相关的库和软件全部打包,用户可以很容易就把平台用起来。”单奖定是联想数据中心业务集团技术总监,他说,联想提供了API,需要研发的客户,拿到LiCO之后还可以进行二次开发。
有趣的是,LiCO最初只是为HPC设计的一个管理平台,由联想的上海软件创新团队开发,它被用来快捷地建立高性能计算集群。之后,联想又在全球部署了四大AI创新中心,为全球用户提供应用创新的支持服务,其中包括中国北京、中国台湾、美国莫里斯维尔,以及德国的斯图加特。
2006年,“深度学习之父”Geoffrey Hinton用一篇联合论文,复兴了沉寂已久的人工智能。在此之后,人工智能的热潮开始席卷这个世界。
LiCO难以避免地被“裹挟”其中。随着人工智能在产业端展现出兴旺发达的未来,联想顺势将LiCO的能力延展到了AI领域。
在2018年世界超算大会(ISC 2018)上,LiCO平台获得了美国HPC权威媒体HPC wire评选的“最佳AI产品技术奖”。
近期Tensorflow也将“最佳AI平台”奖颁给了它。Tensorflow是研究全球人工智能技术和产品市场的市场情报权威机构,它从全球15个国家的2500多种解决方案中选中了LiCO。
这些荣誉让Scott Tease倍感骄傲,因为“LiCO‘产自’上海,而现在,它已经推广到了全球”。Scott Tease是联想数据中心业务集团全球高性能计算与人工智能技术高级总监。
联想数据中心业务集团全球高性能计算与人工智能技术高级总监 Scott Tease
这在行业中是一个相当罕见的现象——作为一家“非典型的软件公司”,联想将国产软件推广到了全球顶级用户中,并占据了行业领先的地位。
硬件层的成就和LiCO的成功相辅相成。在上个月最新一届国际超算大会(ISC 2019)上,联想以173套的成绩蝉联HPC TOP500榜单全球第一,保持了其在全球最大HPC提供商的地位。
调研公司Hyperion Research此前预计,从2017年到2022年,全球超级计算机市场将翻一番,增长至约590亿元人民币。
目前,联想HPC的用户覆盖了科研、教育、航天、气象、汽车、石油石化、生命科学等多个领域。
其中,全球的高校和科研机构在联想全球HPC业务中占比约30%~35%,同时全球前25所研究型大学中,有17所运行了联想的HPC解决方案。
最新的客户是美国的哈佛大学——它是北美第一个使用联想第四代水冷技术——海神(Neptune)水冷技术的超算用户。
“我们需要联想这样具有国际化视野、国际化的能力和全球化资源整合能力的企业。”中国科学院计算技术研究所所长孙凝晖说,他希望联想在把中国的技术带到全世界的同时,也把更多全世界好的技术带回中国。
孙凝晖所看重的这些全球多元化能力,事实上也反哺了联想的HPC业务,并最终成为了联想HPC业务的特性。
在过去20年中,“我们从客户(实践)中学到了各种精华。”Scott Tease说,从温水水冷技术的推出,到HPC与AI的融合……当下联想HPC的众多优势多源于同全球客户的知识互动与分享。
LiCO在6月最新发布的版本为LiCO 5.3,该版本一大特性正是帮助用户管理他们的AI系统,并使其成为一个共享资源和可伸缩的AI。
LiCO版本的迭代同联想HPC各部门的努力同时指向了一个明确的产业目标,联想称之为融合计算。
联想集团高级副总裁、数据中心业务中心中国区总裁童夫尧说,联想将以超算技术为核心,聚焦技术融合、行业融合、生态融合,并从这三个方面来助力行业的破局和发展。
联想集团高级副总裁、数据中心业务中心中国区总裁 童夫尧
新发布的融合计算平台深腾X9000是联想在技术融合方面的最新进展。这个基于行业场景的一体化解决方案,拥有多项HPC、AI和大数据的关键技术,其中包括46项国家发明专利。
深腾X9000集合了AR/VR、分布式训练、人脸识别、语义识别等基本能力,支持服务器HG680X、HG690X,以及采用第二代英特尔®至强®可扩展处理器的SR650、SR670等产品,能够以强大计算能力,加速各行业的创新实践。
而行业融合之所以被强调,是因为AI和大数据正在高速提升HPC与行业的粘性,并大幅拓展了后者的业务空间。
全球广泛的行业用户可以带来海量的行业应用场景需求和实践数据,这对于HPC供应商探索HPC与AI融合提供了可能。没有这一点,HPC可能就将失去一个前景广阔的未来。
“(那样)很容易变成闭门造车。”郭鹏是联想数据中心业务集团能源行业总监,他认为一切最终都要和客户价值诉求融合在一起,“我们需要更多地识别用户的应用场景、实践经验和数据,再由技术研发去考虑如何融合。”
30年前,油气勘探对HPC的需求只在数字处理这一个环节,而今天,从物探的第一个数据采集环节就开始要大量依靠HPC和AI技术。
地震波初至自动拾取是油气勘探涉及的一项技术。“过去30T数据,30人需要处理60多天,全是重复劳动。”赖能和是中国石油东方地球物理研究院数据中心总工程师、教授级高级工程师,他说在HPC与AI技术融合之后,计算机1秒钟就可以拾取1000个点,两种方法的效率是天壤之别。
类似的融合所带来的效率巨大变革,可以想见的海量存在于HPC所覆盖的各个行业中。
中山大学数据科学计算机学院院长钱德沛认为,HPC对大数据和人工智能的支撑作用已经非常明显,新一代人工智能的基础就是计算。“超算改变了人工智能的研究方式。”他说。
黄莹博士是联想集团副总裁、联想研究院企业云和无线实验室负责人,在围绕HPC的新计算需求中他提供了一组数据:
传统HPC需要进行5百万次仿真的工作,HPC AI融合的条件下仅需要6万次就可以完成。
“大数据计算(BDC)和深度学习(DL)同样在与HPC进行融合,同时这也对更高的计算能力提出了要求。”黄莹说,当下火热的工业互联网场景中,“数字孪生”需要数据的“在途”处理,就是HPC和BDC和DL需要进行融合的例子。
“融合是未来的趋势。”中国科学院计算技术研究所所长孙凝晖说,“不光要看到HPC和AI的融合,未来还要看到HPC与移动,HPC与云计算的融合。HPC最终也会以云计算的方式为用户提供服务。”