金磊 发自 凹非寺 量子位 | 公众号 QbitAI
“AI绘画会替代掉大部分从业者。”
在各种Diffusion模型掀起一波又一波AI作画舆论高潮的当下,世界围棋冠军柯洁如是说。
△完整直播见文末
而作为经历过被AI打败、吐槽“受够了AI围棋”的他,在看到AI“入侵”绘画行业后,更是将二者做了个比较:
围棋从某种角度上来解读的话,生存环境要比绘画好一些。
如此一番言论,着实引来了不小的围观,毕竟正如网友所言,“初代AI受害者现身说法”
。
柯洁何出此言?
很简单,因为AI作画这事最近着实有点太火了。
从谷歌家的Imagen、OpenAI出的DALL·E系列开始,它们便成为了网友们整活热捧的AI内容生成神器。
加之后来基于diffusion模型衍生的各种“新玩法”:Disco Diffushion、Stable Diffusion……“AI绘画”一下子更大范围地轰入大众的视野。
而且与之相关的种种舆论消息也是不断。
例如一位小哥用AI绘画工具Midjourney生成的作品拿下艺术比赛一等奖,主办方还照常颁奖了,直接惹怒人类艺术家
。
或许正因如此,柯洁在直播开场中也介绍说“我最近一直在观察AI绘画”:
我没有过多关注AI绘画本身的能力,因为我对它的能力不会有任何怀疑。 但AI绘画并不是什么新鲜的事情,我最早接触它已经是2年前的事情了。
当时柯洁的朋友跟他提及AI绘画有多么多么厉害,不过那时的他还是对此打了一个问号——
这东西能商业吗?好像没有什么前景啊?
结果现在的事实却是,大量资本正在涌入AI绘画。
正如前不久Stable Diffusion背后公司Stability AI曝出再融资1亿美元的消息,直接在圈里炸开,更是让它的估值飙升至10亿美元。
不过让柯洁觉得非常搞笑的一点,还是相关从业者对AI的认知和言论:
有些人认为,我学美术不是为了赚钱的,是为了梦想和价值。
对抱有这种想法的从业者,柯洁给予了肯定:“牛逼”。与此同时,柯洁也发表了不一样的看法:
但对于一些“俗人”来讲,一个行业的灭亡就是从没有利润空间开始的。 大部分人还是要通过绘画、美术来吃饭赚钱的呀。很多人还是会觉得市场没有需求,我学它做什么呢?
然后柯洁对于前者“梦想价值论”的发言者,再次用“搞笑”来形容,并表示:
扶戈威武士,我都自叹不如。
在柯洁看来,围棋都是必须要商业化的,唯有如此,行业才能得以持续。
至于“AI绘画是否会替代人类”这个问题,柯洁也在直播中给出了他的观点:
不可能完全替代,但会替代掉大部分从业者。 而且替代程度和围棋还不太一样。围棋是具备竞技和文化属性的,美术虽然也有文化属性,但缺乏竞技属性。 围棋的生存环境要比绘画好一些。
一石激起千层浪
柯洁的一番言论,确实引发了网友们的热议。
对于“AI绘画”和“AI围棋”这两件事情来说,贴吧网友给出了一点不同之处:
AI围棋目的是赢你,让你不爽。 而AI绘画为你服务,让你感觉独一无二,让你爽。
也有网友赞同柯洁的观点,认为“画师可比棋手惨太多了”:
棋手参加的是体育竞技,只需要在比赛层面上禁掉AI棋手就永远有饭吃。 画师就不一样了,那是商稿产出,一旦AI能低成本满足商稿需求那对应的画师必定会没饭吃。
知乎博主“zpeng”在看完柯洁的直播后认为,“他想回答的意思是资本很喜欢AI画画这件事”。
而后他对于诸如Stability.AI这样的公司,如何通过AI绘画来盈利发表了他的看法(以下观点内容经过授权)。
其实做生成图片的大佬还有DallE2和Imagen这两家。它们分别是微软家的OpenAI和谷歌家的DeepMind的团队弄出来的。
国内微软的nuwa也很棒,可以将清明上河图扩展。同期华为、百度都在做中文的生成模型。
我想大家也很清楚,这些团队的科学家的价钱都不低。聊完资本对于生成图这种东西的态度,再说说游戏公司。
这段时间有一些团队带着它们的需求和我沟通,我大概罗列如下:
- 对于旧图优化渲染;
- 原画转3D视图;
- 对于场景设计自动化;
- 对于不同阵营的设计语言(文案在构思新角色)统一化;
其他还有一些,但我基本没看到说直接用说取代工作的,而更多是赋能。
这是某游戏公司照片的算法工程师:
工作职责之一就是“风格迁移”。其实深度网络算法这块就是,它可能不work,但你融资的时候没有和有差别就很大。
最后聊一聊学术圈。谷歌团队最近刚发的imagic方法:
很多团队在不停提升方法,对其可以落地的部分进行设计、优化甚至升级。
之前我看到很多人说的一个观点“现在AI本身方向就是错的”。对此我并不反对,最近几年很多文章都在说其实全连接层和卷积层效果基本一样。
我们从现在时间节点往前看,很多方法确实存在缺陷,甚至错误,时间线回到1980年那会“神经网络”就等于“垃圾”,再出山时候还要换马甲成“深度网络“。
但正是因为这些不够“完美的”模型才推动了整个行业发展、软硬件技术的堆积、吸引大量人才进入才能让我们找到最优解。
如果一个行业连试错的人都没有,那才是最悲哀的。
柯洁其实想表达的应该是,当大量资本愿意投入到“图像生成”领域,那么更多的科学家、技术人员都会被吸引过去。人力、财力都都堆积起来,会出现什么谁说的好呢?
……
而对于柯洁提及的AI绘画商业化,在量子位智库的《AIGC/AI生成内容产业展望报告》中也有过分析。
我国的AIGC行业尚未建立起明确的变现方式。以写作机器人、自动配音等场景为例,大部分产品仍处在免费试用的流量吸引阶段,收费空间相对较小。
此外,多家公司提及,由于服务B端客户时话语权弱,会考虑向2B2C领域、 乃至直接2C领域延展。
但作为工具,能否在互联网流量相对稳定的前提下有效接触C端用户,设计好产品转化路径,依旧是一项挑战。
而从国外AI绘画的变现方式来看,主要是按产出内容量收费。
包括DALL·E、Deep Dream Generator等AI图像生成平台大多按照图像张数收费。
One More Thing
对于AI绘画这事,还有一个比较有意思的事情。
吴恩达老师最近在知乎发表了一个标题较为惊悚的来信——《人类和鬼魂都在使用AI?!》,谈了谈他对AI生成艺术的看法。
亲爱的朋友们:
人工智能每年都会带来惊人的进步。但是,随着万圣节的临近,物质世界和幽灵世界之间的面纱被缓缓揭开,我们看到,鬼魂世界也和人类世界一样利用了这些发展。
正如我在上周的来信中所写的,prompt engineering(提示词工程)——即编写文本提示以使AI模型生成所需输出的艺术,是一个主要的新趋势。你知道日语中的“提示”一词——呪文——也意味着咒语或咒语?(向自然语言处理开发人员Paul O’Leary McCann致敬。)使用DALL·E 2或Stable Diffusion等模型生成图像的过程确实像是施了一个魔法(更不用说这些程序明显有能力让帕勃罗·毕加索等已故艺术家“复活”),所以日本的人工智能从业者可能会有所收获。
一些人工智能公司正在试图复活逝者。初创公司HereAfter AI生产的聊天机器人在讲话、声音和外观上都像你许久不见的曾祖母。当然,这只是一个模拟,目的是帮助生者与已故亲人取得某种“联系”。根据我从无数僵尸电影中学到的,当谈到复活逝者时,我确信没有什么会出错。
我更关心的是那些似乎决心创造恐怖生物的人工智能研究人员。想想最近对transformer的大量研究。每个transformer都用到了多头关注。什么时候开始有“多个头”是自然的了?研究人员正在潜入我们的电脑中,每个人都在为这项新技术而欢呼!如果说我们对transformer有一点了解的话,那就是事情并不像最初看到的那样简单。
今年也是从掩码输入中学习的一年,掩码自动编码器、MaskGIT和MaskViT等方法在困难任务中取得了出色的表现。所以,如果你戴上万圣节面具,那么你就支持了人工智能进步背后的一个关键想法。
不给糖就捣蛋!
吴恩达
参考链接:
[1]https://www.zhihu.com/question/561728839 [2]https://www.bilibili.com/video/BV1eG411E7nK/ [3]https://www.bilibili.com/video/BV1A84y167iA/ [4]https://zhuanlan.zhihu.com/p/577811634?utm_medium=social&utm_oi=740325373283172352&utm_psn=1569266197987741696&utm_source=wechat_session
— 完 —