明敏 发自 凹非寺 量子位 | 公众号 QbitAI
如果不说,你能看出来下面这幅画又是AI画的吗?
而且还是AI自己生成了语言描述,又通过这些描述画出了图。
没错,这就是GPT-3和DALL·E强强联合之后的效果。
最初给GPT-3的输入是:
写一篇关于一群浣熊去抢劫的电脑游戏描述。
然后,GPT-3“设计”了一款名为《浣熊打劫》的游戏。
描述中详细介绍了游戏背景、玩家角色和需要做的事情。完全看不出是AI写的啊~
接下来,再把这些描述喂给DALL·E,一幅生动的游戏原型动画诞生了。
画面里,两只鬼鬼祟祟的浣熊,在深夜的大街上游走,一副随时准备作案的样子。
画风拿捏非常到位,和常见动画游戏中色调和笔触几乎一个味儿。
更重要的是,整个制作过程,只要不到60秒!
有网友围观后自己上手试了试,让两个AI合力做一个“白鼬在家里玩嗨了”的游戏原型。
生成的游戏介绍和原型动画,都是让人看了直呼偶买噶的程度啊。
甚至都让人有点想玩!
AI创作图文,再次突破想象
实际上,不只是生成游戏原型动画,这两个AI组合还能搞出各种图文原创。
比如睡前故事。
有位网友表示,他让AI以自己儿子、家里狗狗为主角,创作了一个去火星的故事。
从前有个小男孩,他喜欢搭积木,他最好的朋友是一只名叫Mochi的狗狗。 有一天,他们梦想去火星,然后一起做了一个大火箭,飞向了太空。
在网友的展示中一共有9幅画,每一幅都配着简短易懂的文字。
画风也和普通儿童绘本几乎没什么两样,真的很难让人相信是AI创作的啊!
而且只要稍加编辑,还能让DALL·E生成的一系列图像中,主角形象不发生变化(不过这样人物的表情就没有变化了)。
没想到,当代版一千零一夜,竟然能靠AI来讲。
除此之外,最近还有一个用DALL·E 2设计logo的帖子爆火。
一位网友开发了一个名为“OctoSQL”的工具,想要为其设计一个logo。
然后,他就把自己的设计想法告诉了AI:小章鱼玩转数据库、图表。
同时补充了“数字艺术”、“卡通”等关键词,得到了如下效果。
不得不说这效果一开始就很好啊!
但是作者想要更精细一些,所以之后又给了AI十多次关键字来尝试。
其中,在加了“标志”的关键字后,AI给出了黑色圆底的输出,有logo的感觉了。
更为意外的是,DALL·E还能真的像乙方一样调细节。
比如作者确定了要用这只带安全帽的章鱼当logo,但是它手里拿的东西不满意。
那么还能固画面的一部分,来继续换关键字生成新内容。
最终,作者用浏览器反向搜索了一下,生成的章鱼logo是完全原创、没有类似结果的。
网友看后表示:
这个过程,仿佛和找人类设计师来没什么两样啊。
值得一提的是,想要得到如上这些好的输出结果,人类自己还要懂得一些小技巧。
比如GPT-3针对“描述一个XXX的产品介绍”很擅长,那么使用这种句式得到的结果质量会相对高一些。
还有,在DALL·E 2的关键词输入后添加“artstation”效果会更好。
当然了,这些生成的过程中难免发生翻车事件。
有网友表示,自己想要用DALL·E生成一个“Jared’s pizza”的logo,但是输出结果一直是“Jizza”。
One More Thing
由于GPT-3和DALL·E都需要排队申请使用,所以并不是所有人都能试玩。
有网友推荐了craiyonAI,可以替代DALL·E,效果也还不错。
值得一提的是,这次发现AI能做游戏原型动画的网友不是普通人。
他是Django Web的创始人之一Simon Willison。
Django是高水准的Python编程语言驱动的一个开源模型。使用这种架构,程序员可以方便、快捷地创建高品质、易维护、数据库驱动的应用程序。
参考链接: [1]https://twitter.com/simonw/status/1555626060384911360 [2]https://news.ycombinator.com/item?id=32320491 [3]https://jacobmartins.com/posts/how-i-used-dalle2-to-generate-the-logo-for-octosql/
— 完 —
「隐私计算产业展望报告 · 量子位智库」下载
采访数十家机构并深入调研后,量子位智库撰写了《隐私计算产业展望报告》,扫描下方二维码可下载完整报告。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
一键三连「分享」「点赞」和「在看」
科技前沿进展日日相见 ~