在最新的技术进步中,Microsoft 的 AI 聊天机器人 Bing Chat[1] 迎来了一次重大升级,它现在采用了 OpenAI 最新的文本到图像模型 DALL-E 3。这一升级为用户提供了更加逼真和多样化的图像生成能力,以更有效地响应用户的文字提示。
DALL-E 3:将文字变为逼真图像的魔力
DALL-E 3 是一种先进的语言模型,经过训练能够生成逼真的图像。它采用生成对抗网络(GAN)技术,由生成器和鉴别器两个相互竞争的模型组成。生成器负责生成图像,而鉴别器则负责判断图像的真实性。
Bing Chat 利用 DALL-E 3 的生成图像过程如下:
- 用户输入文字提示,例如“一只猫坐在椅子上”或“一座城市的夜景”。
- Bing Chat 将文字提示传递给 DALL-E 3。
- DALL-E 3 生成一组图像,每个图像都符合文字提示。
- Bing Chat 从图像组中选择一张图像并显示给用户。
相较于以前的版本,使用 DALL-E 3 的 Bing Chat 生成的图像更加逼真,富含细节。例如,在提示“一只猫坐在椅子上”下,DALL-E 3 生成的图像可能展现一只猫在椅子上舒适地蜷缩,其毛发柔软而光滑。
潜在用途:创造、教育、广告和娱乐
Bing Chat 利用 DALL-E 3 生成图像的能力具有广泛的潜在用途。它可以应用于创建教育材料、生成营销和广告材料、设计产品和包装、制作创意艺术和摄影,甚至只是为了娱乐。
Bing Chat 的 DALL-E 3 升级现已对所有用户开放。要体验它的强大功能,只需在 Bing 搜索中打开 Bing Chat,然后输入您的文字提示,即可触发这一先进的图像生成技术。这一升级将为用户带来更为生动和个性化的交互体验。当然了,你也可以直接访问 bing create[2] 来生成图片。
参考资料
[1]
Bing Chat: https://www.bing.com/chat
[2]
bing create: https://www.bing.com/create