机器之心报道
机器之心编辑部
DALL·E 中新增的 Outpainting 功能,扩展出的画面只有你想不到。
1665 年,荷兰画家约翰内斯 · 维米尔创作完成了一幅著名油画《戴珍珠耳环的少女》。画中少女的气质超凡出众,宁静中淡恬从容、欲言又止的神态栩栩如生。
你有没有想过,将这幅名画漆黑的背景换成其他场景,效果会怎样?就像下面展示的,背景换成居家摆设,画中女孩看起来多少有了点生活气息。
其实这是 OpenAI 发布的文本 - 图像生成模型 DALL·E 中新增的一个功能:Outpainting,该功能可以让原始图像生成新的视觉效果,扩展图像生成边界。就像上图,通过提示,DALL·E 脑补出了画面之外的内容,即使画像提供的信息有限,该功能也能够模仿原作的阴影和亮点,匹配维米尔的风格。
此前借助 Inpainting 技术,使用 DALL·E 的编辑功能可以对生成或上传的图像进行更改。现在,通过 Outpainting,用户可以扩展原始图像并以任何宽高比生成大尺寸图像。为了与原始图像风格保持一致,Outpainting 考虑图像的现有视觉组件,例如阴影、反射和纹理。
有了这一新功能,网友们纷纷进行了二次创作。有人对《蒙娜丽莎》进行了一番脑补:末日下的蒙娜丽莎。一番创作下来,背景中出现了飞碟、火苗、骷髅…… 还真有种末日到来的感觉。
看完对世界名画的操作后,在看看其他场景。例如我们在看电影时,经常会出现好莱坞电影制片厂派拉蒙影业标志,猜猜下图哪部分是 AI 脑补出的?
为了进行直观比较,还有人进行了前后对比。我们以「骑马的人」为例。左边是 Outpainting 生成的,右边是没有 Outpainting 生成的原始图像。相比右边来说,左边画面内容更加丰富,表现出的场景更多:
如今,已有超过 100 万人正在使用 DALL·E,艺术家们已经开始基于新的 Outpainting 功能创建图像。用户可以通过 Beta 版本使用这一绘画工具,每个 Beta 用户在第一个月可以获得 50 次免费图像生成,之后的每个月有 15 次的使用权限。不过你也可以花费 15 美元购买, 可获得 115 次使用权。想要上手一试的小伙伴可以访问:
DALL·E 地址:https://openai.com/dall-e-2/
后补名单地址:https://labs.openai.com/waitlist
参考链接:
https://www.theverge.com/2022/9/5/23337580/openai-dall-e-text-to-image-generator-outpainting-native-function
https://openai.com/blog/dall-e-introducing-outpainting/
掌握「声纹识别技术」:前20小时交给我,后9980小时……
《声纹识别:从理论到编程实战》中文课上线,由谷歌声纹团队负责人王泉博士主讲。
课程视频内容共 12 小时,着重介绍基于深度学习的声纹识别系统,包括大量学术界与产业界的最新研究成果。
同时课程配有 32 次课后测验、10 次编程练习、10 次大作业,确保课程结束时可以亲自上手从零搭建一个完整的声纹识别系统。
点击阅读原文,了解更多课程内容。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com