迄今为止,全球超过一半的数据都在过去两年产生,仅有不到2%的数据经过了处理和分析。
如何让疫情“黑天鹅”转化成发展新机遇?新冠疫情的突然到来更像是催化剂——将科技转型这一选择摆到企业面前。
大浪淘沙,危中蕴机。事实证明,拥有数字底蕴和创新基因的企业在疫情下仍能保持竞争力。
人工智能在助力复工复产的突出表现更是吸引传统企业更快地拥抱AI。据Gartner 预测,在2021年大约会有 70% 的企业和机构将通过在工作场所中引入人工智能来提高员工生产力。
决心已下,如何寻找部署突破口?
事实上,从对象检测到自然语言处理 (NLP),不管人工智能各种用例的差异有多大,它们都有一个共同点:数据。
数据如未来石油,成为产业变革驱动力,企业需要为人工智能部署做好充足的数据准备。
如今英特尔CPU在计算基础设施领域的根深蒂固、在AI领域的早早布局,加之帮助企业进行AI转型实例的长期摸索,形成一套完善的、为AI部署所做的“数据准备”法则。
清查企业数据“存货”,5大步骤确认数据价值
在企业真正下决心拥抱人工智能时,需对自身进行两大“灵魂拷问”:
现在是否已经到了需要用AI解决问题的时机?
是否针对人工智能可在哪些方面发挥最大业务价值设定了优先级?
数据是人工智能的基石之一,那么针对上述问题企业需要考虑的是:我们是否有完备的数据作为转型AI支撑?我们最想发挥所持有数据的哪些价值?
据市场研究调查,迄今为止,全球超过一半的数据都在过去两年产生,仅有不到2%的数据经过了处理和分析。在此背景下,英特尔建议通过五大步骤确定数据价值。
明确数据的位置:在正式部署AI之前,大多数公司的数据广泛分散在企业各处,且来源各不相同,形成数据孤岛,因此必须先找到并清楚了解所有数据库,并掌握拥有的数据类型。
评估数据:只有高质量的数据才能助力企业实现人工智能优势,据 IBM 估计,劣质数据给美国经济造成的年度损失令人震惊, 高达 3.1 万亿美元。
清理数据:企业中的数据通常不能直接拿来使用,它们的原始状态都比较杂乱,通常需要对这些数据进行标记并单独存放。
集中数据:集中数据包括对数据进行标记,人工智能和机器学习都需要依靠标签来准确地分析数据并产生洞察。
收集数据:从训练到自然条件下的持续推理,应确定所有所需的相关数据源。
风险最小价值最大,通往人工智能概念验证的道路
在确定后数据价值后,下一步的重点就转移到如何运用人工智能。
举棋容易落子难,投入回报比、自身软硬件基础能否跟得上等诸多现实问题都在左右企业的AI转型计划。其实,这可以借助概念验证 (PoC) 相对轻松地完成。
概念验证不但可以成为帮助决策者探索人工智能影响的宝贵工具,还能实现价值最大化和风险最小化。英特尔提供了如下方法:
第一步,确认机遇:当明确想要通过人工智能达到何种目标后,才应开始人工智能概念验证。
第二步,明确问题并分析数据:确认基本目标后,可对手中持有的数据资源进行分析;
第三步,评估商业价值:可以包括准确性、完整性、及时性、规模、兼容性、灵活性和工程设计。
第四步,制定解决方案架构及部署,这将需要一系列技术支持,包括:
- 基础硬件产品和系统基础设施
- 面向人工智能的软件增强功能,用于驱动基础设施
- 启用人工智能框架,用于支持计划使用的解决方案
- 虚拟化技术、前端软件和/或硬件
第五步,纵向扩展概念验证:在完成第 1 步到第 4 步后,需要依照总体人工智能策略优化概念验证,使其发挥预期作用。
至强集成AI加速,英特尔推出软硬件结合大礼包
人工智能概念验证的第四步——制定解决方案架构及部署,或许是最令企业头疼的步骤。
为人工智能部署做好数据准备过程中,如何寻找到技术支撑成为决定企业拥抱AI效率与效果的重要一步。
英特尔至强处理器作为世界上许多数据中心的基础,处理着大多数计算机视觉和深度学习推理工作负载。但是,人工智能应用可以从硬件和软件优化中进一步受益。
第二代英特尔至强可扩展处理器在软件优化和硬件指令方面进行了大幅改进,集成英特尔深度学习加速技术,为人工智能和各类以数据为中心的应用提供了灵活性。
西门子医疗正是利用集成英特尔深度学习加速技术的第二代英特尔至强可扩展处理器,为面向心脏病学的人工智能加速。
利用英特尔技术优化的人工智能使心脏 MRI(磁共振成像)的心脏功能量化提速高达 5.5 倍。
此前,为从 CMR 图像中提取定量测量数据,心脏病专家通常使用手动或半自动的工具。然而,这个步骤不仅十分耗时、容易出错,而且在解读图像时会受到用户间主观性的影响。
根据此前的人工智能概念验证,西门子医疗对于AI挖掘数据价值的要求则是让数据更精准,且处理数据更加快速——在临床工作流程中运用AI绝不能以延迟作为代价。
相比于GPU,在处理大量人工智能工作负载时, 至强可扩展处理器能够更好地满足整合人工智能模型的产品需求。这也使得医疗设备公司能够以更低的成本向客户提供人工智能解决方案,高性能平台功能使他们不再需要专用加速器。
心脏 MRI(磁共振成像)的心脏功能量化提速则是得益于英特尔深度学习加速技术带来的高效低精度卷积、int8 中的有效连接和重采样操作优化。
神经网络经过训练,可识别心脏的各个区域。西门子医疗使用OpenVINO™ 工具套件分发版将西门子医疗训练过的模型从 fp32 量化为 int8,并确保精度不受影响。
使用OpenVINO™ 工具套件分发版执行的量化过程
至强集成AI加速,健康和生命科学行业可以利用AI来集成和分析大量数据,提高诊断准确性,改善医疗现状。
“黑科技”持久内存应运而生,化解数据中心痛点
为AI部署做好数据准备另一个需要克服的难关是内存问题,随着算法的发展以及数据的激增,存储的需求也随之增加。
存储技术必须跟上计算技术的发展,更低的延时和更高的安全性也日益成为数据传输的刚需。
英特尔傲腾持久内存兼顾了内存级性能,和大容量持久化存储能力
如今短视频时代到来,用户量和短视频作品数量呈现爆炸式增长,短视频平台的存储系统的优化和性能提升,面临着非常艰巨的挑战。
国内短视频领域的领先企业快手,为应对短视频应用中高吞吐率、大数据量请求应用场景带来的挑战,将英特尔傲腾持久内存产品应用于推荐系统和Redis服务。
事实上,快手在推荐系统中采用了计算与存储分离的架构,存储型服务为推荐系统中上亿规模的用户画像、数十亿规模的短视频特征以及千亿规模的排序模型参数提供存储和实时更新能力。
而传统的DRAM存在价格昂贵,内容容量规格受限等短板,且存在内存易失性。
引入英特尔傲腾持久内存构建的异构存储系统
而在Redis服务中,英特尔傲腾持久内存大容量的特性,令快手单Redis服务器内存容量达到了TB级。在满足性能需求的同时,傲腾持久内存还能帮助快手推荐系统的TCO降低30%。
如今,人工智能以全新的方式挖掘数据价值,数据的价值也推动着企业创新,实现这些的前提则是认清自身持有的数据价值,做好数据准备。
在如今特殊的背景下,就像英特尔联合创始人罗伯特.诺伊斯所说得:莫为历史所羁绊,放手而为创绚烂。