文: Melissa Heikkilä 2022 年4月22日
翻译:陈超校对:zrx
本文约1800字,建议阅读5分钟一些人担忧关于这些工具喋喋不休的讨论正在对整个领域造成负面的影响。
这个月早期,DeepMind发布了一个新“通才”AI模型Gato。该模型由Alphabet旗下的AI实验室发布,它可以玩Atari视频游戏,字幕图像,聊天以及用真正的机器人手臂堆叠块。总之,Gato可以做604种不同任务。
Gato虽然有无法拒绝的魅力,但是自从其发布后的一周内,部分研究者已经有点儿得意忘形。
DeepMind一位顶尖研究者和Gato论文的合作者Nando de Freitas并不能抑制他们的激动。“游戏结束了!”他在Twitter中写到,小明从Gato到人工普遍智能已经有了一条相当清晰的路径,或者AGI,一个模糊的概念人类或超人类水平的AI。他说,这种建立AGI的方式,是一个规模的问题:将Gato这样的模型做大做强。
意料之内的是,de Freitas的宣言引来了纷至沓来的新闻报道,称DeepMind是人类层面人工智能的“边缘”,这并非炒作第一次超越现实。其他振奋人心的新AI模型,例如OpenAI的文本生成器GPT-3以及图片生成器DALL-E,也已经有大量的类似言论。对于这个领域当中的大多数,这种狂热的话语已经掩盖了对AI其他重要研究领域的关注。
这是非常负面的事情,因为Gato是非常有趣的一步。一些模型已经开始将不同技能整合在一起:举个例子,DALL-E从文本描述中生产图片。其他人则使用简单的训练技术学习识别图片和句子。DeepMind的AlphaZero学会了下围棋,象棋和将棋。
与Gato不同的是,AlphaZero一次仅能学习一个任务。在学习围棋之后,它不得不忘掉所有的内容才能继续学象棋,以此类推。它并不能一次学习两种游戏。这就是Gato所做的工作:它可以同时学习多种不同的任务,这意味着它可以在不忘记之前所学的内容的同时就转换到新任务的学习当中。这是很小但却很重要的进步。然而, Gato也有其不足之处,它并不会像那些一次只学一个任务的模型表现那么好。机器人仍然需要学习关于世界如何从文本中运作的“常识”,MIT助理教授Jacob Andreas这样说,他的研究领域关注人工智能和自然语言以及语音处理。这可以帮助房子周围的人的机器人中派上用场,例如,“当你把机器人放在厨房,并让他们第一次泡茶,他们知道泡茶的步骤有哪些以及柜子里的茶包放在何处”Andreas说。
一些外部的研究者非常明确地反对de Freitas的观点。“这与‘智能’相距甚远,”在深度学习领域的大牛Gary Marcus说道。Gato的炒作表明AI领域被毫无价值的“胜利主义文化”所困。深度学习模型经常会对达到人类智能水平的潜力产生极强的兴奋,但他们犯了一个错误,“如果一个人犯了这些错误,你会觉得这个人有问题” Marcus说。“大自然试图在这里告诉我们一些事情,那就是这并不真正起作用,但这个领域是如此相信自己的新闻剪报,以至于它看不到这一点。”他补充道。
de Freita的DeepMind一起研发Gato的同事Jackie Kay和Scott Reed在我问及他们对de Freita观点的看法时还更慎重一些。当被问及Gato是否朝着AGI的方向发展时,他们并没有被引导。“我并不真的认为通过这类东西来预测是可行的。我尽力避免这样做。这就像在预测股票市场。”Kay说。Reed说这个问题太难了:“我认为最机器学习的人将会有意地避免回答。非常难以预测,但是你知道,或许某一天我们有希望做到。”
在某种程度上,DeepMind将Gato叫做“通才”的事实可能会让其成为AI关于AGI过度炒作的受害者。今天的AI系统是“狭义的”,这意味着它们仅仅能做特定的,有限制的任务,比如生成文本。一些技术人员,包括DeepMind的一些人,认为有一天人类将会开发出“更广义”的AI系统,它们能够与人类相媲美甚至比人类更出色。虽然一些人把这种叫做人工通用智能,另外一些人则将愿意将此称为“相信魔法。”许多顶尖研究者,像Meta的首席AI科学家Yann LeCun,对这是否有可能提出质疑。
Gato是一个“通才”它可以同时做许多任务。但是这与可以有意义地适应与以往所训练的任务完全不同的新任务的“通用”AI完全不同,MIT的Andrea这样说:“距离这一目标的实现,我们仍然还远得很”。做更大的模型也不强调模型不能“终身学习”的问题,这意味着如果学了一次,他们就能理解所有的线索并将其用于指导其他所有的决策,他说。
对Gato这样的工具大肆炒作对通用AI的发展并无益处,Emmanuel Kahembwe,一个AI和机器人研究者这样说,他也是与TImnit Gebru共同创立的Black in AI组织成员。“许多有趣的话题被抛之脑后,没有获得足够资助,需要得到更多关注,但是这并不是大型技术公司以及在这些技术公司的大量研究者们所感兴趣的,”他说。
技术公司应该往回走一步,为什么他们在做现在正在做的工作, 一个为人工智能项目“向善”提供资金的慈善机构Patrick J. McGovern Foundation 主席Vilas Dhar说道。“AGI值得是一些深度人类的东西——我们通过构建促进我们变强的工具变得更像我们,”他说。“除了它也是一种让我们分散注意力的方式,让我们从今天面临的真正问题中转移注意力,这些问题应该通过AI解决。”
原文标题:
The hype around DeepMind’s new AI model misses what’s actually cool about it
原文链接:
https://www.technologyreview.com/2022/05/23/1052627/deepmind-gato-ai-model-hype/
编辑:王菁
校对:王欣
译者简介
陈超,北京大学应用心理硕士在读。本科曾混迹于计算机专业,后又在心理学的道路上不懈求索。越来越发现数据分析和编程已然成为了两门必修的生存技能,因此在日常生活中尽一切努力更好地去接触和了解相关知识,但前路漫漫,我仍在路上。
翻译组招募信息
工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。
你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。
其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。
点击文末“阅读原文”加入数据派团队~
转载须知
如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。
发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。
点击“阅读原文”拥抱组织