著名的电影特效公司IndustrialLight&Magic使用了IBM最新的刀片式服务器替换了他们的服务器。新的刀片s式服务器机架配有84台服务器,每组机架节省了140千瓦的用电量,这大约是这个机架用电量的84%。这一切都要归功于高性能计算机的支撑。HPC不仅仅计算性能强大,而且更高的效能也更加有利于低碳环保,其应用范围也在不断拓宽。
除了重视低碳环保之外,高性能计算机的发展势头也是越来越猛。近期,美国能源部DOE宣布了两个国家实验室将更新的系统,一个是橡树岭国家实验室新超算,峰值计算速度达到了150-300PetaFLOPS;还有一个就是劳伦斯利弗莫尔国家实验室,新的系统会达到100 PetaFLOPS的计算速度。这些高性能计算机都采用了NVIDIA的技术,包括NVLink以及与IBM合作。
高校与科研机构成为超算领头羊
就像国外的高性能计算中心一样,国内HPC发展也是从高校以及科研机构所启动的。据了解,2013年底,一个被命名为“π”系统的超级计算机在上海交通大学上线运行。该系统峰值性能达到263万亿次,位列最新全球Top500榜单第158名,将用于支持俗称“Top500”的惯性约束核聚变项目等高端科研工程。
据了解,上海交大π系统采用了“CPU GPU MIC”三重混合计算架构,有25.7万个计算核心,其计算性能已超过此前上海地区最先进的上海超算中心的“魔方”。
NVIDIA(英伟达)中国区技术市场经理邓培智介绍,目前在全球大型的GPU系统里,上海交大π超算系统的加速器和GPU的利用率是最高的。林新华老师所在的上海交大,在高性能计算方面也拥有非常强的实力,他们刚刚获得了世界大学生超级计算机竞赛(ASC)的冠军。
深度学习受热捧
Google在世界各地的数据中心拥有海量计算机,计算量绝对绰绰有余。但配置如此强大的计算机集群并不是一件容易的事情,如果有一台服务器忽然当机(如果你同时使用1000台机器,这种事情几乎每天都会发生),就会减小准确性。这是深度学习世界里众多问题之一,如今大数据和人工智能里最热的议题是:与云计算的发展不符。Google、亚马逊和Facebook已经使用云计算在数万台计算机上运行软件。
阿里巴巴资深技术专家王琤在接受本站记者采访时表示:深度学习就像一个黑盒子,可能有的人并不具备相关背景,但他直接用了这个工具的话,就可以达到一个前所未有的结果,相当于极大的降低了门槛,把以前很难做的工作以极低的成本做起来,这是它的一个很大的优势。
高性能计算助力基因排序
计算性能的提升,给基因研究带来了巨大的帮助。华大基因高性能计算研发主管王丙强博士在接受赛迪网记者采访的时候表示:在10几年前,如果对人体基因进行样本测序,需要计算10年甚至更久。而当应用了NVIDIA Tesla GPU的超级计算机之后,则只需5个多小时。
华大基因王丙强博士所指的超级计算机就是目前位于我国天津高性能计算研究所的天河一号A,其搭配的就是NVIDIA Tesla GPU计算卡。而华大基因自己也有数据中心,采用服务器集群方式来计算,同样也配备了Tesla GPU。软件方面则都通过编译和优化,可以很好的支持GPU计算,这方面NVIDIA的CUDA功不可没。
GPU多流处理器架构以及超高的显存位宽和频率能够带来巨大的性能提升,在基因研究方面普遍可以带来10-20倍左右性能提升,如果说DNA上有一个点发生的基因突变,仅计算那一部分大概就可以提升70多倍。原来在华大基因自己高性能计算平台上做,大概要好几年才能算完,后来转移到到天河一号A上去,用超级计算机加上NVIDIA Tesla GPU加速,只要5个多小时就能完成。
超级计算机让石油勘探更高效
一直以来,石油勘探行业都是高性能计算的大用户。为解决数据处理瓶颈问题,川庆物探开始寻找一种具有快速部署、高密度运算能力的数据中心解决方案。经过详实的调研论证和查阅大量国内外资料,川庆物探于2007年提出了在物探领域进行集装箱式数据中心应用的创新思路。经过方案论证,最后决定依托IBM的PMDC(便携式模块化数据中心)解决方案开发专门针对物探行业的集装箱式数据中心。经历了5年的探讨和测试,到2011年集装箱数据中心成功投入运行。
作为新一代的数据中心,在石油勘探应用方面最受关注的重点依然是性能。此次中石油部署的PMDC集装箱数据中心也表现优异。其采用了标准的20英尺集装箱,借助现代化物流可快速部署至全球任何地区。同时,采用高密度设计,使PMDC的占地面积很小,仅相当于同等性能数据中心占地面积的1/4。PMDC内部配置有128个IBM BladeCenter刀片服务器和100T的存储容量,通过技术优化和调试,数据处理效率较原来临时数据中心提升了10多倍。