2款AI芯片、深度学习框架MindSpore:华为史无前例集中发布AI战略

2018-10-22 10:41:54 浏览数 (1)

机器之心报道

作者:李泽南

今天上午,在上海举行的 2018 全联接大会上,华为轮值董事长徐直军宣布了华为的 AI 战略与全栈式解决方案,同时发布了两款全新 AI 芯片以及跨平台深度学习框架。可以说,这是近年来 BAT 等巨头高调投入 AI 之际,华为高层首次对外宣布集团层面的 AI 战略。

华为本次发布的 AI 全栈式解决方案,让这家公司成为目前全球唯一提供 AI 全栈软件和系列化芯片的提供商。同时,华为还提供了一套与之配套的统一开发框架。

华为 AI 发展战略

AI 是基础生产力,这个观点是华为通过自身的实践总结出的经验,现在华为希望把提升自身生产力的技术开放出来,供所有人使用。「自 2017 年起,华为就确定了构建万物互联的愿景,」华为轮值董事长徐直军表示。「为此,华为制定了 AI 发展战略。如同工业化革命期间的电力和铁路一样,人工智能是 21 世纪的新通用目的技术。」

徐直军表示,华为之所以强调 AI 是一种通用技术,是为了让我们正视 AI 的价值,AI 不仅能够让我们高效解决已经解决的问题,还可以解决很多未解决的问题。

华为认为,人工智能带来的改变将涉及所有行业,包括交通、教育、医疗和金融。而人工智能引发的变革才刚刚开始,目前我们正处在 AI 应用与社会环境相互碰撞的时期。在研究层面,2017 年全球发表的机器学习论文数量已经达到了 2 万余篇,目标检测、机器翻译的性能超越人类;而另一方面,只有约 4% 的企业已经投资或部署了 AI 技术,5% 的高等教育机构使用了 AI 等等,这反映出应用层面的冷静。现阶段,这种研究与应用之间的落差令人欣喜,同时选择解决正确的问题是最重要的任务。

徐直军表示,为了弥合这种研究与应用之间的差距,AI 需要以下十大改变:

华为花费很长时间介绍了目前人工智能面临的 10 大挑战。基于这十大改变,华为的 AI 发展战略包括五个方面:

  • 投资基础研究:在计算视觉、自然语言处理、决策推理等领域构筑数据高效(更少的数据需求)、能耗高效(更低的算力和能耗),安全可信、自动自治的机器学习基础能力。
  • 打造全栈方案:打造面向云、边缘和端等全场景的、独立的以及协同的、全栈解决方案,提供充裕的、经济的算力资源,简单易用、高效率、全流程的 AI 平台。
  • 投资开放生态和人才培养:面向全球,持续与学术界、产业界和行业伙伴广泛合作,打造人工智能开放生态,培养人工智能人才。
  • 解决方案增强:把 AI 思维和技术引入现有产品和服务,实现更大价值、更强竞争力。
  • 内部效率提升:应用 AI 优化内部管理,对准海量作业场景,大幅度提升内部运营效率和质量。

基于这样的考量,华为提出了自己的全栈 AI 解决方案。

全栈全场景 AI 解决方案

据介绍,华为的全栈方案具体包括:

  • Ascend: 基于统一、可扩展架构的系列化 AI IP 和 芯片,包括 Max、Mini、Lite、Tiny 和 Nano 五个系列。包括今天发布的华为昇腾 910(Ascend 910),它是目前全球已发布的单芯片中计算密度最大的 AI 芯片,还有 Ascend 310,它是目前面向计算场景最强算力的 AI SoC。
  • CANN: 芯片算子库和高度自动化算子开发工具。
  • MindSpore:支持端、边、云独立的和协同的统一训练和推理框架。
  • 应用使能:提供全流程服务(ModelArts)、分层 API 和预集成方案。

此前曝光的「达芬奇计划」旨在让 AI 技术融入华为的所有产品和业务,包括为云服务器研发的专用 AI 加速芯片,也包括 5G 技术的研发,在智能摄像头等终端设备、甚至智能驾驶上抢夺先机。

其中,华为自研的人工智能计算芯片是重中之重。「如果说算力的进步是当下 AI 大发展的主要驱动因素,那么,算力的稀缺和昂贵正在成为制约 AI 全面发展的核心因素。」徐直军表示。

今天,华为发布了两颗全新的 AI 芯片:Ascend 910 与 Ascend 310。

华为首席架构师党文栓介绍说,Ascend 芯片采用统一达芬奇架构:可扩展计算、可扩展内存、可扩展片上互联。因此,这是全球首个覆盖全场景的智能芯片系列。

AScend 910

AI 云芯片是人们关注的重点。「媒体一直在预测华为正在开发 AI 芯片,今天我要告诉你:你们的猜测是对的!」徐直军说道。

在发布会上,华为简要介绍了两款芯片的性能指标,服务器芯片昇腾(Ascend)910 采用 7nm 制程,最大功耗为 350W,算力比英伟达 Tesla V100 还要高出一倍。华为称,昇腾 910 是目前单芯片计算密度最大的芯片。华为并不像谷歌一样只在自己的服务器中使用 AI 云芯片,这款芯片将于明年二季度正式上市。

在发布芯片的同时,华为还发布了大规模分布式训练系统 Ascend 集群,在设计中,该集群将包括 1024 个 Asced 910 芯片,算力达到 256P,大幅超过英伟达 DGX2 和谷歌 TPU 集群。这种服务器将同样在 2019 年二季度推出,帮助开发者更快地训练模型。

Ascend 310

与高功耗的 910 一同推出的 Ascend 310 是昇腾迷你系列的第一款产品。据称这款芯片功耗为 8 瓦,采用 12nm 工艺,算力可达 16TFLOPS,其集成了 16 通道全高清视频解码器,具体性能见上图。

除此之外,在 2019 年华为还将发布三款昇腾 IP:Ascend Lite、Ascend Tiny、Ascend Nano。华为还将发布基于 Ascend 310 的多款 AI 产品,分别面向不同场景,如 Atlas800、MDC 600 等。

基于昇腾 310/910,华为还将提供相应的加速卡和服务器,以支持公有云、私有云服务。

华为希望提供全栈、全场景的开发平台,因此今天华为还发布了深度学习框架、算子开发工具 CANN 以及提供全流程服务的分层 API 和预集成方案。

CANN 与 AI 框架 MindSpore

在硬件之上,华为还提出了完整的软件堆栈,以实现一次性算子开发、一致的开发和调试体验。华为希望能够帮助开发者实现一次性开发,应用在所有设备端、边缘及云端平滑迁移的能力。

其中,算子库 CANN 面向人工智能不断出现的多样性算子,兼顾了高性能和高开发效率。其中的 Tensor Engine 实现了统一的 DSL 接口、自动算子优化、自动算子生成,以及自动算子调优功能。值得一提的是,华为在 Tensor Engine 中采用了陈天奇等人提出的 TVM。华为称,CANN 可以实现 3 倍的开发效率提升。

MindSpore 是华为提出的 AI 框架,与 TensorFlow、PyTorch、PaddlePaddle 等框架并列。华为认为未来的 AI 将会由任务驱动,非常个性化。随着技术发展,安全问题和算力问题成为重要挑战。欧盟推出的 GDPR 法案让很多互联网公司被迫重新规制自身业务;另一方面,自 AlexNet 到 AlphaGo Zero,人工智能算法的算力需求也提升了 300000 倍。

MindSpore 可覆盖终端设备到云服务器的所有场景。在发布会上,华为介绍了 MindSpore 设备端深度学习框架,其容量只有不到 2m 大小,运行时占用内存不到 50m。华为表示,MindSpore 同时也支持目前所有主流深度学习框架中的模型。

在框架之上,华为还为开发者提供了更为高级的 ModelArts,这是一个机器学习 PaaS,提供全流程服务、分层分级 API 及预集成解决方案。

「AI 将重新定义应用开发,」首席战略架构师党文栓表示。「我们的 ModelArts 将支持全流程模型生产,支持人工智能条件下的开发流程。」

华为还推出了面向生产自动化的 ExeML

在兼容性方面,华为表示,目前的 Cloud EI 也支持 GPU 的开发。华为提供的预集成解决方案支持公有云和混合云环境。

在今年 8 月于重庆召开的首届智博会上,华为云 BU 总裁、华为副总裁郑叶来表示,华为将围绕「用得起、用得好、用得放心」三个方面进行深入探索,最终实现「普惠 AI」。在今天的一系列产品发布之后,相信我们已经对华为的全部愿景有所了解。

0 人点赞