「华为速度」,在AI计算领域到底该如何评价?
一言以蔽之:暴力美学。
而且这种速度,由浅及深地拆分来看,可以分为两层。
首先,是物理意义上的超高速度。
这种能力在刚刚结束的第十六届全国高性能计算学术年会(CCF HPC China 2020),最能直接展现。
在这场全球范围内、高性能计算领域最具影响力的三大顶会之一上,华为Atlas 900凭借其超强的AI算力,打破自己创下的纪录,在ResNet-50上的跑分仅需28秒。
其次,是更深层次的华为AI速度。
从2018年华为全联接大会(HC)首次对外宣布AI战略开始,仅仅2年时间,便在技术、产业、人才和生态各方面,展露出了「领军姿态」。
现在,是时候完整揭秘一下华为AI的暴力美学了。
Atlas 900速度如何问鼎业界第一?
Atlas 900,从去年9月诞生开始,便打上了「世界最快AI产品」的标签。
训练ResNet-50只需要59.8秒,比当时排名第二的选手快出了15%之多。
而时隔短短一年,Atlas 900超越自己,再次创造了世界纪录。
在HPC大会上,华为昇腾计算业务CTO 周斌介绍道:
Atlas 900凭借其超强的AI算力,使得ResNet-50的训练时间仅需28秒!相比去年59.8秒的测试成绩缩短一半以上,体现了Atlas 900软硬件协同优化的持续演进能力。
△华为昇腾计算业务CTO 周斌
据介绍,集群芯片数量仅为1024颗昇腾910芯片,而其它同类产品在芯片数量方面都要比Atlas要多,甚至达到了2倍。
并且,从单芯片算力来看,昇腾910能够达到320TFLOPS的超高算力。
在算力飞速迭代、发展的今天,Atlas 900能够保持业界第一,离不开其背后的一套「杀手锏」。
这套「杀手锏」就是华为AI计算中心解决方案。
多样性算力方面,通过统一API AscendCL 接口,支持GPU和NPU资源统一调度和管理。
除此之外,还提供端边云协同、统一运维、全栈服务等能力,这就使得Atlas 900在全球范围内具备竞争力。
而这,就是华为在硬件方面的暴力速度。
但在拥有了这样的速度之后,用来做什么,也是一个值得思考的问题。
华为AI发力HPC,Why?
此次大会中,华为昇腾计算业务CTO周斌的一番演讲,道出了问题的答案。
「我们处在爆炸式创新前夜」,这是周斌首先抛出来的一个观点。
以数据量为例,从今年的44ZB,预计到2025年,便会增长到180ZB;智能互联网设备将从340亿增长到1500亿;计算中心AI的工作量将从现在的小于10%,增长到80%……
虽然高性能计算(HPC)在处理海量数据问题时,能够带来一定的优势,但面对如此爆炸性增长,还是远远不够。
新增的大量数据、接入设备,对计算带来了空前的挑战。
对此,周斌在现场抛出了他的观察:
AI和HPC的融合,是未来发展的一大趋势。 AI改变传统HPC计算的求解方法。
例如,2018年入围「Gordon Bell」决赛的6个应用中,有半数用AI HPC融合的应用示范。
再者,在高性能计算领域著名榜单Top500中,近30%系统拥有加速卡/协处理器。换言之,越来越多的系统配有大量低精度算术逻辑单元,用来支撑人工智能计算能力需求。
尤其榜单前十名都使用AI计算的能力。
并且,「AI HPC」已经在众多领域崭露头角:
- 在全球气象领域,美国国家大气研究中心(NCAR) 用CNN网络预测冰雹概率, 用82000个不同的风暴样本训练后,测试32000个已知的风暴样本,冰雹预测准确率达88%。
- 在监控地球脉动方面,美国国家航空航天局 (NASA) 开发出通过深度学习网络 DeepSat,用于实现卫星图像分类和分割。
- 在医学领域,佛罗里达大学和北卡罗来纳大学结合使用深度学习,开发出一种神经网络引擎,该引擎能够以超低成本生成计算快速的高精度分子模拟,用于药物研发。
而这些工作、研究,若是仍旧采用传统HPC手段来处理,不仅成本上会有大量的消耗,效率方面也会大打折扣。
一言蔽之,「AI HPC,让一切皆可计算」。
这也正是华为发力HPC的原因,以Atlas 900为代表的「华为速度」也逐渐在此生根发芽。
然而,Atlas 900的速度,也只是华为AI暴力速度的冰山一角。
如何评价华为AI的速度?
暴力美学,为何可以这样评价。
其实,回顾一下华为AI这两年的发展,便可知其一二。
首先,是于技术。
华为Atlas人工智能计算解决方案,可以说是近年来华为在AI技术发展中的集大成者。
从2018年首次提出,到现在仅仅2年时间,发展到了「云边端」全场景布局,而且在互联网、金融、能源、制造等众多领域实现了落地。
再以「昇腾AI全栈」为例:
- AI算子开发方面,「异构计算架构CANN」在两年时间里迭代到了3.0版本。
- AI模型开发方面,全场景AI计算框架MindSpore在今年3月份正式开源,仅6个月后,便发布1.0版本。
- AI应用开发方面,MindX 1.0极简易用的特性,能满足那些没有深度开发能力的开发者;以及ModelArts也已步入了3.0时代,从训练数据到模型落地一站式打通。
- 全流程开发工具链 MindStudio2.0,涵盖了算子开发、模型训练、模型推理、应用开发和应用部署。
当然,以昇腾为基础的AI全栈,也已成型。
而它们的搭建,仅仅才2年时间。
其次,产业维度,一组数据就能说明问题。
以鲲鹏、昇腾为基础的发展过程中,已经涵盖了30万开发者、1000 合作伙伴、3000 解决方案认证,并且还在以每月,甚至是每周的速度在迭代更新。
以如此速度在AI产业大步向前行进,道路的坎坷程度可想而知,而华为却说到做到。
以及,于人才、开发者和高校。
华为已经在70 所高校开设了AI课程,积累了10万 开发者进行AI开发,凝聚出了120多个行业智能化转型解决方案。
今年,华为也会在推进AI技术研发的同时,再度加码生态培育——投入2亿美元发展计算产业生态。
所以这种「暴力美学」,也会更快让高校和产业用得上、用得起、用得好~