机器学习和人工智能是一个推动不同行业重大创新的领域。据预测,2023年,人工智能市场将达到5000亿美元,2030年将达到15971亿美元。这意味着机器学习技术在不久的将来将会有持续的高需求。
然而,机器学习行业发展非常迅速:新技术和科学研究定义了新产品和服务的构建方式。2022年底,从机器学习工程师到初创公司创始人,每个人都在寻找下一年最有希望的趋势。
01 机器学习技术趋势
由于每天都有新的创新出现,我们永远无法100%肯定地预测明年会有什么样的技术需求。但根据我们在2022年看到的情况,以下是2023年最有希望的机器学习趋势。
1.1 基石模型(Foundation models)
大型语言模型是一项重要的创新,最近很受欢迎,而且在之后较长的一段时间很可能会一直伴随着我们。基石模型是一种人工智能工具,即使与常规神经网络相比,也可以根据大量数据进行训练。
工程师们希望计算机不仅要通过搜索模式进行理解,还要积累知识来达到新的理解水平。基石模型在内容生成和摘要、编码和翻译以及客户支持方面非常有用。众所周知的基石模型案例有GPT-3和MidJourney。
基石模型的一个惊人之处在于,它们还可以快速扩展,并处理从未见过的数据,因此具有出色的生成能力。这些解决方案的领先供应商是NVIDIA和Open AI。
1.2 多模态机器学习
在计算机视觉或自然语言处理等涉及模型与现实世界交互的任务中,模型通常只能依赖一种类型的数据,图像或者文本。但在现实生活中,我们通过许多感官感知周围的世界:嗅觉、听觉、视觉和味道。
多模态机器学习通过多种方式(模态)来体验我们周围的世界的事实来构建更好的模型。“多模态(MML)”就意味着要构建可以像人类一样一次以多种模态感知事件的ML模型 。
建立MML可以通过组合不同类型的信息并在训练中使用它们来实现。例如,将图像与音频和文本标签相匹配,使其更易于识别。到目前为止,多模式机器学习是一个很新的领域,尚待2023年开发和发展,但许多人认为它可能是实现通用人工智能的关键。
1.3 Transformers
Transformers是一种人工智能架构,它使用编码器和解码器对输入数据序列进行转换,并将其变换为另一个序列。许多基石模型也建立在Transformers上。我们想单独提出它们,是因为它们用于许多其他应用程序。事实上,据报道,Transformers正在席卷AI世界。
Transformers也被称为Seq2Seq模型,广泛用于翻译和其他自然语言处理任务。因为Transformers可以分析单词序列而不是单个单词,所以它们通常显示出比普通人工神经网络更好的结果。
Transformers模型能够分配权重,以评估序列中每个单词的重要性。然后,该模型将其转换为不同语言的句子,并考虑到分配的权重。可以帮助您构建Transformers Pipeline的一些领先解决方案是 Hugging Face和Amazon Comprehend。
1.4 嵌入式机器学习
嵌入式机器学习(或TinyML)是机器学习的一个子领域,它使机器学习技术能够在不同的设备上运行。
TinyML可用于家用电器、智能手机、笔记本电脑、智能家居系统等。正如ABI Research的AI&ML首席分析师Lian Jye Su所解释的:
人工智能的广泛应用和生活化推动了物联网(IoT)分析的发展。从物联网设备收集的数据用于训练机器学习(ML)模型,为物联网整体产生有价值的新思路。这些应用需要依赖复杂芯片组的强大且昂贵的解决方案。
嵌入式机器学习系统的日益普及是芯片制造业的主要推动力之一。如果说十年前,根据摩尔定律,芯片组上的晶体管数量每两年翻一番,这也让我们能够预测计算能力的增长,那么在过去几年中,我们已经看到了每年40-60%的飞跃。我们相信,这一趋势在未来几年也将持续下去。
随着物联网技术和机器人技术的广泛普及,嵌入式系统变得更加重要。Tiny ML领域有自己独特的挑战,这些挑战尚待2023年解决,因为它需要最大限度的优化和效率,同时节省资源。
1.5 Low-code和No-code解决方案
机器学习和人工智能几乎渗透到了从农业到营销到银行业的各个领域。使ML解决方案易于非技术员工使用通常被管理者认为是保持整个组织效率的关键。
然而,与其经历漫长而昂贵的编程学习过程,不如简单地选择需要零或接近零编码技能的应用程序。但这不是No-code解决方案可能要解决的唯一问题。
Gartner发现,市场上对高质量解决方案的需求比Deliver的可能性更大——“Deliver这些解决方案的速度至少比it能力快5倍”。(Gartner has found that the demand for high-quality solutions on the market is bigger than the possibilities to deliver – “it grows at least 5x faster than IT capacity to deliver them”.)
No-code和Low-code解决方案可以帮助弥补这一差距并满足需求。同样,Low-code解决方案使技术团队能够更快地提出并测试他们的假设,从而减少交付时间和开发成本。如果10年前,需要一整个团队来构建应用程序或启动网站,那么今天只要一个人就可以做到同样的事情,而且速度很快。
此外,82%的组织在吸引和保持软件工程师的质量和数量方面遇到困难,这些组织更愿意在No-code和Low-code技术的帮助下构建和维护他们的应用程序。
虽然近年来出现了许多Low-code和No-code解决方案,但总的趋势是,与常规开发相比,它们的质量仍然较差。能够改善现状的初创企业更能在人工智能市场中拔得头筹。
最后,值得一提的是,随着训练ML模型所需的计算能力的快速增长(特别是对于大型组织中运行的实时ML),云计算仍然是创新的一项重要技术支撑。据统计,全球约60%的企业数据存储在云端,这一数字可能会继续增长。2023年,我们将看到为了满足ML行业不断增长的需求,对云安全和恢复能力的投资将会持续增加。
02 2023年ML的技术领域TOP
Gartner已经确定了未来7-8年内有望发展最多机器学习的技术领域。主要领域包括:
- 创造性人工智能。用于生成文本、代码,甚至图像和视频的人工智能在2022年获得了广泛的关注,特别是随着MidJourney发布了SOTA图像生成网络、DALLE-2、Stable Diffusion和Open AI发布了新的text-davinci-003。2023年,将新一代的人工智能用于时尚、创意和营销的产品和服务将会有大量需求。
- 分布式企业管理。随着远程工作成为一种常态,公司必须寻找新的方式来管理员工并保持效率。根据Gartner的说法,ML将帮助分布式公司发展并增加收入。
- 自动化。从安全到银行业,许多行业对能够承担日益复杂的任务并适应快速变化条件的自主软件系统的需求都很高。提供更智能自动化的新创产品将在2023年出现。
- 网络安全。随着各个生活领域的日益数字化以及保护敏感信息的必要性,网络安全的重要性与日俱增。ML和AI被认为在保护私人数据和保护组织安全方面发挥着至关重要的作用。
03 结论
2023年,机器学习依然会是一个有前途且快速发展的领域,将带来许多有趣的创新。大型语言模型、多模态机器学习、Transformers、TinyML以及No-code和Low-code解决方案是在不久的将来非常重要的新兴技术。
2023年,将越来越多地使用ML的一些技术领域是创造性人工智能、自动化系统、分布式企业管理和网络安全。Gartner预测,到2023年,ML将渗透到更多的业务领域,帮助提高效率和工作安全。
精彩推荐
1. 书籍推荐 - 《可解释机器学习》
2. 书籍推荐 -《深度强化学习》
3. 字节跳动李航:人工智能的未来,需要新的范式和理论
4. AIGC大一统模型来了!CV界泰斗黄煦涛创立团队提出「全能Diffusion」
5. 中国信通院 - 京东探索研究院《人工智能生成内容(AIGC)白皮书(2022年)》