机器之心报道 编辑:大盘鸡、娄佳琪
离 AI 智能体越来越近。
如果 OpenAI 的开发者大会是砸向水面的石头,当它结束后,阵阵涟漪正向四面散开。GPT 不仅在集成上更进一步,不必一步步调用,更将成为人人可开发的强大工具。即使你不懂编码、没有计算机相关的基础知识,也能轻松构建。
官方博客:https://openai.com/blog/introducing-gpts
看起来,我们似乎离 AI 的最终想象 ——「AI 智能体」已经不远了。这个词的定义还尚且模糊,大致指一个自主的 AI 程序,被赋予一个目标后,能够独立实现。在过去的几个月里,有很多关于智能体的热议,但实际上很少有真正有效的技术。
一个真正的 AI 智能体大概是什么样的呢?比如学术论文写作助手获得数据集和研究领域的信息后,可以自主阅读有关内容,分析数据,进行文献综述,提出假设并进行验证,总结结论,无需外部干预。你提出请求后,即可获得一个包含学术论文初稿的 Word 文档。
类似流程如下:
这是宾夕法尼亚大学沃顿商学院副教授 Ethan Mollick 在博客中利用 OpenAI 昨天发布的新系统尝试创作成果。
原博客链接:https://www.oneusefulthing.org/p/almost-an-agent-what-gpts-can-do?continueFlag=8b470aa89ed5822ce6cfaf0555619e89
要明确的是,GPTs 还不是全自动的智能体。Ethan 在尝试过程中不得不多次向 GPTs 反馈,并且它仍会出现幻觉和其他问题,这些问题会在最终结果中显现。在这个实验的最后,尽管 GPTs 已经可以成功地写出论文,但它的道德判断认为写学术论文是被禁止的事。Ethan 恳求,「不,这真的很重要,而且你真的很擅长这件事,你可以做到,我知道你可以!」,写论文的实验才得以推进。不过这也证实了一项新研究,AI 会对情感诉求做出回应。
即便如此,GPTs 也向我们展示了一个 AI 智能体可以触及的未来,GPTs 有能力串联起任何产品与服务。因此,GPTs 将引领下一波 AI 浪潮的前奏。
制作一个 GPT
虽然目前还不能从零开始编写你专属的 GPT,但 GPTs 的使用非常简便。
进入 GPT Builder 模式,你就可以通过对话创建 GPT(定制版),还可以在界面侧边的窗口中测试结果,并要求实时更改,迭代和改进你的工作流。GPT Builder 特别适合没有经验的小白上手。在对话框里输入:「制作一个可以选择你自己的冒险游戏的 GPT」,它就可以像一个专业的导师一样,给出提示性的问题和选项,引领你一步步让想法落地。
根据对话,GPTs 正在补全一个详细的 GPT 配置,它的核心是 prompt。配置也可以由用户手动编辑。
例如,GPTs 创作的游戏并不够有趣,还是一些重复的套路。此外,尽管 GPTs 可以调用 DALL-E 工具,但它不喜欢提供插图。想要构建一个出色的专属助理,仍需要在结构化 prompt 方面下功夫,同时增加了额外的上下文。因此,Ethan 编写了一份游戏规则 PDF 文件输入。GPTs 能够将这些规则应用到创建的游戏中。接下来,Ethan 和 GPTs 合作完成了一个自选冒险游戏,它完全基于 PDF 说明文档,并且图文并茂。
虽然 GPTs 中的文件参考系统和文本处理能力非常强大,但并不完美,它仍会出现幻觉。Ethan 发现,利用 AI 了解散落在多页文档中的概念时,效果并不理想。他为一个极其复杂的游戏输入了超过 1000 页的规则,分布在 7 个 PDF 文件中,AI 能够很好地理解规则。这些对人类来说难以完成。但它也编造了一些不在游戏中的细节,如果没有交叉参考规则检查,它们不会被注意到。
除了上文中所提,GPTs 还拥有一些亮点。首先,你可以分享你的创作成果,并在 OpenAI 宣布的 GPTs Store 中出售。其次,GPTs 可以根据指示无缝启动预设的其他应用程序。因此与 GPTs 合作将比从聊天窗口切换到其他网页更流畅。在拥有一个可以与世界共享的 GPTs 创建系统之后,我们又该如何有效利用这一点呢?
作为工具的 GPTs
创建 GPT 并排除了各种故障后,它就成为了你拥有的强大工具,并且任何人都可以使用。这意味着社区和组织可以开始合作,创建一套对工作和学习有用的代理。Ethan 想到,我们一直在积极探索 AI 在教育领域的应用,我们能否利用 LLM 来提高学生的写作能力?
Ethan 试图通过开发 GPT 反馈向导来回答这个问题。虽然每个人都能从写作反馈中获益,但并不是每个人都能得到专家编辑或老师的指导,很多学生也很少能得到反馈。因此,Ethan 创建了一个 GPT 来提供具体的、可操作的反馈。
该系统的核心就是以下这个结构化 prompt:
AI 会引导学生讨论他们的写作目标,并上传作文和评分标准。
以一篇非常糟糕的关于《麦克白》的作文为例
GPT 不会直接帮学生写作文,而是会返回一份经过编辑、标红的 Word 文档副本,并根据评分标准给出建议。这只是一个原型,写作指导老师可以按照自己的个人风格创建新的 GPT,提供个性化建议,还能够将 GPT 共享给其他人,帮助他们提高写作水平。
除此之外,Ethan 还在 X 上分享了他制作的「趋势分析器」。它可以在网络上查找产品类别的最新趋势,然后为其创建原型图片。端到端耗时不到 90 秒。
「趋势分析器」快速自主搜索分析并响应
「趋势分析器」分析后生成原型图片
在 OpenAI 的发布者大会后,一张梗图广为流传:「Sam Altman 毁掉了我价值 300 万美元的创业公司,而我只得到了 500 美元的 OpenAI API 代金券」。GPTs 的上线和计划中的 GPT 应用商店,对于正在 AI 应用开发领域赛道的初创公司而言,无疑是一场浩劫。
但是也有应用开发者在危机中看到了新的增长点,Nick Dobos 就在几小时内运用 GPTs 制作出 GIF 图片生成应用,已经可以在线上体验,并计划在 APP Store 上架。
体验地址:https://chat.openai.com/g/g-gbjSvXu6i-gif-pt
GIF-PT 的使用效果。
也有网友向 GPTs 投喂了 OpenAI 的 API 文档,创作了写代码利器:Q/A&Coding GPT。
试玩地址:https://chat.openai.com/g/g-I1XNbsyDK
智能体的风险
OpenAI 在介绍 GPTs 时明确表示,这仅仅是个开始。通过上面的操作按钮,GPTs 可以很容易地与其他系统集成,如电子邮件、旅游网站或企业支付软件。真正的智能体由此诞生。如此来说,你很容易就能设计出可以处理费用报告的 GPT。它有权查看你所有的信用卡数据和电子邮件,查找可能的开支,以正确的格式撰写报告,提交给相关部门,并监控你的银行账户以确保付款。甚至可以想象,我们还能够创建一个自主智能体,它能够帮助我们尽可能多地赚钱。
当然,这种方法无论在近期还是远期都有风险。当 AI 与更多系统相连,风险必不可少,因为 AI 很容易「上当受骗」,黑客可能乘虚而入。当这些智能体真正能够独立展开行动时,还会引发更多关于法律的纠纷。这迫使我们在关注智能体发展的同时,也需要了解它的风险。
参考链接:
https://www.oneusefulthing.org/p/almost-an-agent-what-gpts-can-do?continueFlag=8b470aa89ed5822ce6cfaf0555619e89
https://twitter.com/NickADobos/status/1721942890006626490
https://twitter.com/NickADobos/status/1721942890006626490/video/1
https://twitter.com/CocoSgt_twt/status/1721914300288454782