Nat. Mach. Intell. | 评判人工智能的创造力

编译 | 曾全晨审稿 | 王建民

今天为大家介绍的是来自Tanmoy Chakraborty的一篇讨论人工智能能力的文章。直到最近，“生成模型”（generative model）一词是仅在人工智能（AI）研究社区中使用的专门术语，但随着DALL-E、Make-A-Video、ChatGPT和MusicLM等生成内容的AI程序的发布，情况发生了变化。这些生成模型使用提示技术来组合看似逼真的内容。顾名思义，提示是以口头方式提供的初始指令，以促使这些模型产生输出。全球许多用户现在每天都在与这些系统进行互动，并对它们的创造能力感到兴奋。

生成式人工智能模型的输出在面向客观主题的提示时可以进行正式审核。例如，当系统被问到“阿伏伽德罗常数是多少？”时，输出的准确性可以以一种直接的方式进行衡量。但是对于提示“画一幅马在太空中骑行的图片”，如何判断输出的正确性呢？创意作品可能涉及技术方面的因素，但这些标志只能部分地对创意进行评判。评估创造性的要素是困难的；这对于人类创造的任何技术或非技术作品都是如此，对于通过生成式人工智能模型组合的内容来说可能尤为如此。

在没有直接的评判创造力的方式，也没有可供比较的事实依据的情况下，我们如何了解通过提示这些AI模型所实现的创造性正确性的程度？这个讨论变得更加具有挑战性，因为生成模型是在人类数据上进行训练的，也就是说，它们覆盖了人类想象力和创造力的范围。因此，当这些系统产生输出时，它们的内容从根本上就是派生的。AI模型能以绝对意义上的创造力创作吗？而且，我们如何调整我们关于新颖性的理论，以适应从人类向机器的创造性转变？

创造力的理论将人类（作为个体和社会）置于创造过程的中心。这些系统研究了智力和创造力的不同但互补的方面，以及它们之间的动态相互作用。然而，这些理论需要修订，以适应人与机器的互动和计算机辅助生成。可以说，“人工”模型是在从网络上生成的人类数据上进行训练的，旨在捕捉人类的“智慧”，因此必须按照评判人类的相同标准来评判。当人们考虑另一个人创作的创意作品时，文化时代精神、艺术家的社会政治立场和情感状态在引导接收者的观点上起着重要作用。简而言之，作品的背景以及它对社会的短期和长期影响是评估创意作品时考虑的一些方面。外部因素在评估和提升创意作品方面起着重要作用，与个体的独创性、创新性和执行力相等。此外，接受一个创新的概念并不是与时间成线性关系的；也就是说，一个想法可能不会立即获得批准。

然而，生成式人工智能模型缺乏创作者和接收者之间的认知、社会、政治和时间上的联系。唯一的联系是生成提示的人的情感状态和他们选择的输出。假设我们认为提示中的独创性决定了创造性结果的程度。那么结果所代表的不是模型的创造力，而是人类的创造力。但是完全否定AI的生成能力似乎过于简单。这些综合因素增加了评估AI模型创造性正确性的复杂性。

作者建议研究界专注于构建一个动态的测试套件，以评估AI的创造能力，并覆盖更广泛的领域。目标应该是涵盖不同程度的主观线索，并在提示中增加一系列相关概念，这些概念的整合难度逐渐增加。作者鼓励不同的研究人员、艺术家和用户共同参与这些系统的开发。另一个更基本的挑战是定义在什么参数下输出将被认为是具有创造性和良好组合的，前提是这些概念需要对AI生成模型有更好的理解和解构。不可避免的是，努力理解生成式AI模型的创造力也将拓展人类想象力的视野，改变我们对世界的认知。随着时间的推移，持续的反馈和评估可能会赋予生成式AI模型独特的创造标志。

参考资料

Chakraborty, T., Masud, S. Judging the creative prowess of AI. Nat Mach Intell 5, 558 (2023).

https://doi.org/10.1038/s42256-023-00664-y

人工智能 nat 模型数据系统

0 人点赞