ChatGPT 之所以能风靡全球,很大程度上要归功于其简单的功能框架。作为一款 AI 聊天机器人,它唯一的作用就是生成令人信服的自然语言文本、顺畅回应用户的提问。 但 AI 聊天机器人的使用体验,往往由用户设计提示词的水平所决定。有鉴于此,新型应用 Auto-GPT 应运而生,它允许 AI 自主行动 — 即实现“自我提示”,并彻底改变我们对于这项技术的看法和感受。对于这一工具,有外媒的标题甚至称,“ChatGPT 已经过时”。
Auto-GPT 是什么?
Auto-GPT是一款开源 Python 应用程序,由开发者用户 Significant Gravitas 于 2023 年 3 月 30 日发布至 GitHub。该应用程序以 GPT-4 为基础,允许 AI“自主”行动,无需用户详尽提示每个动作。大家可以为 Auto-GPT 制定一个总体目标,再由它逐步采取行动以实现目标。这就是“AI 智能体”概念的来源 — 使用互联网资源以完全独立的方式在 PC 上执行操作,不再需要一步步接受提示和引导。
GitHub 上还发布了一个简单示例,展示 Auto-GPT 如何浏览网络并为“即将到来的下一个节假日”准备聚餐食谱。这时 Auto-GPT 会化身“大厨 Chef-GPT”,帮助用户在网上搜索正确答案。之后,它会将食谱以文件的形式保存在用户计算机内。
就功能本身来看,这似乎算不上什么创新大事件。但 Auto-GPT 代表用户搜索互联网并执行文件保存操作的能力,已经让这款AI远远超越了简单的聊天机器人。
Auto-GPT 是如何工作的?
Auto-GPT 的迷人之处,在于它能够对 AI 的运行步骤做拆分,真正把 GPT 模型出色的文本生成能力转化为可用功能。Auto-GPT 把整个过程分解成“思考”、“推理”和“评价”几个环节,准确告知用户 AI 正在做什么、为什么这么做。在前面的 Chef-GPT 示例中,它的“思考”方式如下:“我将搜索即将到来的节假日,据此创建出独特的食谱。”而“推理”部分,则是“只要确定了节假日的具体内容,就能确定食谱的相应设计。”
至于“评价”环节,Auto-GPT 会对所做工作表达一些担忧和限制。可以看到,Auto-GPT 正在以完全自主的方式一步步达成用户指定的目标。
Auto-GPT 还拥有其他一些神奇的能力,包括长/短期记忆和集成 ElevenLabs 提供的文本到语音实现。所有这些功能的结合,让 Auto-GPT 在感受上更像是能与人类真正互动的AI智能体。
Auto-GPT 用例
人们正在发掘 Auto-GPT 的各种可能用例。虽然目前仍处于起步阶段,但因为它属于纯开源项目,所以任何人都可以尝试这款工具。Twitter 上就出现了一个简单的“Ecommerce-GPT”示例,其目标是自主开发和运营电子商务业务,旨在帮助用户增加净资产。
如何使用 Auto-GPT
与其他 GitHub 项目一样,Auto-GPT的设置过程不只是下载文件或者访问网站。在上手之前还需要满足一些重要的前提条件,比如安装有 Python 3.8(或更高版本)、OpenAI API 密钥和 Pinecone API 密钥。如果希望使用可选的文本转语音功能,还需要用到 ElevenLabs API。
用户可以在 Auto-GPT GitHub 页面上找到相关链接及其他重要信息。在满足以上三项要求后,单击“Code”并下载 Zip 文件。当然,用户也也可以通过 Git 应用程序获取这些文件。
首先打开命令行程序,例如 PowerShell,并在其中输入“git clone https://github.com/Torantulino/Auto-GPT.git”以克隆代码仓库。
第二步是在 PowerShell 中输出“cd ‘Auto-GPT'”以导航至项目目录。之后,输入“pip install -r requirements.txt”来安装所需的依赖项。最后,将文件“.env.template”重命名为“.env”并填写您的 OpenAI API 密钥。
在安装完成之后,Auto-GPT 的实际使用其实非常简单。它会要求用户先为机器人命名,之后再提供想达成的目标。它甚至提供两个示例,引导朝着正确的方向前进。
Auto-GPT 实现通用人工智能了吗? 不少 AI 爱好者把 Auto-GPT 视为通往人工通用智能(AGI)的第一步。确实,Auto-GPT 表现出了推理和通过多个自主步骤达成目标的能力,其长/短期记忆机制也让它能够不断学习更多新鲜事物。
但很多人仍然认为,一系列相互关联的提示并不能让系统真正获得“智能”;也有人坚称,人类的大部分智能和行为就是以这种方式实现的。