整理 | 凌敏、核子可乐
开放 API 之后,开发人员可以将 ChatGPT 和 Whisper 模型集成到自己的应用程序和产品中。
1 OpenAI 宣布开放 ChatGPT 和 Whisper API
3 月 1 日,OpenAI 宣布正式推出面向商业用户的 ChatGPT 和 Whisper 语音转文字模型 API,开发人员可以通过 API 将 ChatGPT 和 Whisper 模型集成到自己的应用程序和服务中,并由此访问到最前沿的语言(不止于聊天)以及语音到文本功能。
据 OpenAI 介绍,通过一系列全面优化,自去年 12 月以来,OpenAI 已经成功将 ChatGPT 的使用成本降低了 90%。 现在,OpenAI 将这一成本优势通过 API 向用户交付。
开发人员可以在 API 中使用 OpenAI 的开源 Whisper large-v2 模型,并享受到速度更快、成本效益更高的体验。ChatGPT API 则为用户带来持续改进的模型质量,并提供选项以供开发者深入控制这套模型。OpenAI 表示,公司将认真倾听开发人员的反馈意见,完善了 API 服务条款,以期能更好地满足开发者需求。
ChatGPT API:2 美元可输出约 75 万个单词
据介绍,OpenAI 此次开放 API 的是 ChatGPT 模型家族成员 gpt-3.5-turbo,
也是 ChatGPT 产品使用的同款模型。此次发布的 gpt-3.5-turbo-0301 将至少支持至 6 月 1 日。4 月,OpenAI 还将发布 gpt-3.5-turbo 的下一个稳定版本。
定价:0.002 美元 / 每 1000 tokens。
根据 OpenAI 官网的解释,token 可以理解为一个非结构化的单词,1000 个 token 大概对应 750 个词。也就是说,2 美元即可输出 75 万个单词。这个价格相当于 GPT-3.5 的十分之一。
OpenAI 正在不断改进 ChatGPT 模型,希望能把增强功能交付至更多开发者手中。早期测试人员只需略微调整提示,即可从 text-davinci-003 迁移至 gpt-3.5-turbo。使用 gpt-3.5-turbo 的开发者将始终获得 ChatGPT 推荐的稳定模型,但同时也可以灵活选择更符合需求的特定模型版本。
此外,OpenAI 表示,如果开发人员通过该 API 运行大量数据,他们也可以获得一个专用的 ChatGPT 实例。不仅能优化工作负载的硬件性能,也将带来远低于共享基础设施的使用成本。开发人员也可以全面控制实例负载(更高的负载能改善吞吐量,但可能降低每条请求的响应速度),或启用更多新功能(例如设置更长的上下文窗口),以及保存模型快照。
Whisper API:6 美元可使用 1000 分钟
Whisper 是 OpenAI 于 2022 年 9 月开放的语音转文本模型,但其运行难度颇高。现在,OpenAI 通过 API 发布了 large-v2 模型,可以提供方便的按需访问,价格为 0.006 美元 / 分钟。此外, OpenAI 还对服务堆栈做出高度优化,保证其始终拥有理想的运行速度。
Whisper API 现已通过 OpenAI 的 transcriptions 和 translations 端点开放,并可接受多种格式(m4a, mp3, mp4, mpeg, mpga, wav, webm)。
语音转文本指南:
https://platform.openai.com/docs/guides/speech-to-text
集成 ChatGPT 和 Whisper 的早期用户示例
OpenAI 还给出了一系列已经集成 ChatGPT 和 Whisper 的商业伙伴案例。
Snap 推出 My AI
Snapchat 是一款“阅后即焚”照片分享应用,月活用户高达 7.5 亿。Snapchat 母公司 Snap 本周在付费服务 SnapchatPlus 上公布了 My AI。这项实验性功能运行在 ChatGPT API 之上,能够为 Snapchat 用户们提供一个友好且支持自定义的聊天机器人。该机器人能够提供建议,甚至在几秒钟内为好友写出诗词俳句。
根据 Snapchat CEO Evan Spiegel 介绍,最初只有每月 3.99 美元的 SnapchatPlus 付费订阅用户才能使用这款 ChatGPT 产品,但未来最终目的是服务于 Snapchat 所有 7.5 亿用户。
根据使用者体验,Snapchat 没有刻意给 My AI 设计专属界面,也没有交互提示和弹窗,只需打开空白的聊天页面就能开始对话,对它的设计更像是内置的“一个朋友”而不是搜索引擎。
Quizlet 推出 Q-Chat
Quizlet 是一个全球学习平台,有超过 6000 万学生在利用它学习、练习和巩固自己当前的课业内容。Quizlet 过去三年来一直与 OpenAI 保持着合作,通过多种用例(包括词汇学习和随堂测试)对接 GPT-3。
随着 ChatGPT API 的推出,Quizlet 也推出了 Q-Chat。这是一位具备完全自适应性的 AI 教师,能通过有趣的聊天体验提供研究材料,吸引学生们参与到学习当中。
Instacart 推出 Ask Instacart
Instacart 正在强化自家同名应用,希望更好地理解客户提出的食物相关问题,给出高质量的购物建议。这自然要依托于 ChatGPT、Instacart 自家的 AI,以及来自 75000 多家零售合作伙伴的产品数据。以此为基础,客户能够轻松为自己的开放性购物需求找到理想答案,例如“怎样做出美味的鱼肉塔可?”或者“怎样给孩子准备一份健康午餐?”Instacart 还计划在今年晚些时候推出 Ask Instacart 新功能。
Shopify 的 Shop 应用
Shopify 的消费者应用 Shop 已经拥有 1 亿用户,他们在这里与自己喜爱的产品和品牌积极互动。ChatGPT API 将成为 Shop 应用中的全新购物助理。在用户搜索产品时,购物助理会根据他们的要求提供个性化建议。Shop 的 AI 驱动新助理将扫描数百万件商品以快速找到符合买家预期的条目,或者启发他们接触新产品,从而简化应用内的购物体验。
Speak 应用
Speak 是一款 AI 支持的语言学习应用,希望能为用户提供理想的口语训练服务。Speak 已经成为韩国增长最快的英语学习应用,而且新的 AI Speaken Companion 服务也引入了 Whisper API。Whisper 在面对各个水平的语言学习者时,都能达到与人类相近的理解能力,由此实现真正的开放式对话实践和极为准确的反馈。
2 1 天烧掉 10 万美元,ChatGPT 加速商业化
ChatGPT 的爆火帮助 OpenAI 开启了下一个时代,也让越来越多的人关注到这家 AI 公司。
在此之前,OpenAI 一直面临盈利压力,此前曾有一些大型 VC 公司放弃了对 OpenAI 的投资,其中一些投资者对 OpenAI 是否撑得起这样高的估值表示怀疑。
在成功推出 ChatGPT 之后,OpenAI 在资本市场面临着如何从 ChatGPT 等产品中获利的压力。据了解,ChatGPT 的运营成本不菲。根据 OpenAI 联合创始人兼 CEO Sam Altman 的介绍,ChatGPT 的运营费用“令人瞠目结舌”,每次聊天的平均计算成本都要好几美分(ChatGPT 托管在微软 Azure 云上)。
摩根士丹利的分析认为,ChatGPT 的一次回复可能会花掉 OpenAI 2 美分,大约是谷歌搜索查询平均成本的七倍。尤其考虑到 ChatGPT 面向全球大众用户,用的人越多,带宽消耗越大,服务器成本只会更高。也就是说,每天至少要烧掉 10 万美元。
为了保证 ChatGPT 能够长期运营下去,OpenAI 需要想出合适的商业化路径。在今年 1 月公司官方 Discord 上发布的公告中,OpenAI 明确表示“已经在考虑如何推动 ChatGPT 商业化”,借此“保证该工具拥有长期生命力”。
目前来看,ChatGPT 的商业化之路已是多点开花。除了前文提到的通过开放 API 盈利,ChatGPT 还曾推出了付费的专业版本。
今年 1 月下旬,OpenAI 推出付费版 ChatGPT——ChatGPT Pro,每月 42 美元。作为 ChatGPT 的高级版本,ChatGPT 专业版具有几大优势:不存在任何“中断”(即不可用)窗口、不设节流、可支持无限数量的 ChatGPT 消息(至少两倍于常规每日上限)。
2022 年年底,OpenAI 曾给投资者送了一剂“定心丸”。据三位知情者透露,OpenAI 向投资者表示,预计 2023 年营收将会达到 2 亿美元,2024 年将达到 10 亿美元。一位知情者称,OpenAI 在去年 12 月下旬曾二次发售股票,公司估值达到 200 亿美元。
2023 年,能否实现 2 亿美元营收的“小目标”,就看 ChatGPT 的表现了。
参考链接:
https://openai.com/blog/introducing-chatgpt-and-whisper-apis
今日好文推荐
一场向应用交付标准的“冲锋”
没有 NGINX 和 OpenResty 的未来:Cloudflare 工程师正花费大量时间用 Rust 重构现有功能
开源意味着不问责,我们准备好应对比 Log4Shell 更大的安全危机了吗?|Log4j 一周年特别报道
阿里过去一年裁员达19000人;字节跳动布局中国版 ChatGPT;马斯克称下周将开源推特算法代码 | Q资讯