杨净 发自 凹非寺 量子位 | 公众号 QbitAI
AI艺术家DALL·E达利,竟成梗图之王?
这阵子,国内外社交网络上,都刮起了一阵“达利”meme风。
比如这个,带着14公斤鱼的蜘蛛侠,这不就是我的日常摸鱼状态吗?
恐怖分子皮卡丘,还是很可爱怎么回事?
在Twitter上,有网友专门发起了#DalleMeme话题,同时Reddit上也已经开设了专栏weirddalle,目前已有9万人关注、每天近千人实时在线。
有个账号每天靠发“达利”meme图,几个月时间已经攒粉近百万。
可以说,达利家族真的靠梗图彻底出圈了。但就在大家玩得不亦乐乎的时候,达利的缔造者OpenAI却坐不住了:
改名!改名!改名!
这是怎么回事?
梗图之王,并非真DALL·E
原来,靠梗图出圈的“达利”,并非真正的达利。
它叫做DALL·E Mini,达利迷你版,比正版多了个Mini,但两者完全没有任何关系。
据作者介绍,当时几个志同道合的开发者,在达利的启发下,在Hugging Face上搞了个mini版,结果还获了奖。
主创之一Boris Dayma,在此基础上继续开发并将其开源。
免费的“达利”谁不用,要知道真正的DALL·E 2目前只有少部分内测资格~
于是乎,梗图之王就此诞生。
据Wired报道,Hugging Face的CEO曾大吐苦水:我们的工程师第一天晚上都没有睡觉。
要为这些模型提供大规模服务真的很困难。
而最近几周,达利迷你版每天会提供大约50000张图像。甚至有媒体称,已成互联网上最受欢迎meme生成器。
作者透露,达利迷你版的设计结构很简单。
核心两个组件:语言模型 图像解码器,它从互联网上数百万个图像-文本标题对学习而来。
语言模型使用的是BART,它并不直接处理文本,而是类似于序列到序列之间的建模。
以文本离散序列为输入,输出为图像的离散序列,然后用图像解码器VQGAN生成图像。
△哥斯拉骑单轮车
OpenAI坐不住了:改名!
就在达利迷你版爆火全网之际,OpenAI坐不住了,要求原作者改名。
迫于压力下,达利迷你版更名为了Craiyon,不过在Hugging Face上的界面名称还没有变。
不少网友表示:可以理解,这是一定会发生的事。但好的工具只会因为它的优点获得认可,而非营销噱头。
与此同时,OpenAI这边还在强调“为了与广大观众分享DALL·E的魔力”,时不时地在博客上发布一些规避风险的举措。
就在最近,他们在预训练过程加了过滤器,删除并重新加权了一些图像。
比如一些涉及军事枪支、暴力和性的图像,都会在过滤之后消失。
这一波对比操作, 被不少网友调侃:
你们还在测试,达利迷你版那边已经玩嗨了。
One More Thing
就在达利迷你版更名之际,又一个版本——min(DALL·E)诞生了,号称是最小实现。
它已被剥离成基本要素,并转换为 PyTorch,目前GitHub上已有上千星。
感兴趣的旁友,可戳下方链接了解~
https://github.com/kuprel/min-dalle Craiyon体验链接 https://www.craiyon.com/ https://huggingface.co/spaces/dalle-mini/dalle-mini
参考链接: [1]https://www.wired.com/story/dalle-ai-meme-machine/ [2]https://openai.com/blog/DALL·E-2-pre-training-mitigations/ [3]https://www.reddit.com/r/MachineLearning/comments/vmi13r/p_dalle_mini_stripped_to_its_bare_essentials_and/ [4]https://twitter.com/iScienceLuvr/status/1536294746041114624 [5]https://twitter.com/weirddalle [6]https://www.reddit.com/r/weirddalle/ [7]https://www.reddit.com/r/dalle2/comments/vgtgdc/openai_who_runs_dalle2_alleged_threatened_creator/
— 完 —
「人工智能」、「智能汽车」微信社群邀你加入!
欢迎关注人工智能、智能汽车的小伙伴们加入我们,与AI从业者交流、切磋,不错过最新行业发展&技术进展。
ps.加好友请务必备注您的姓名-公司-职位哦~
点这里