问耕 发自 麦蒿寺 量子位 出品 | 公众号 QbitAI
OpenAI发布了逆天的GPT-2,举世皆惊。
这个拥有15亿参数的语言AI,写起文章来文思泉涌毫无违和感,无需针对性训练就能横扫各种特定领域的语言建模任务,还具备阅读理解、问答、生成文章摘要、翻译等等能力。
但,这还不是全部。
各路研究者发现,GPT-2其实还学了好几种编程语言。
比方,JavaScript。
纽约大学工程学院的助理教授Brendan Dolan-Gavitt发现,GPT-2在学会写英文的同时,还悄悄学了一些js脚本语言。 证据:
以及sample 195证明,GPT-2貌似还懂一点PHP语言……
Facebook AI研究院的Tim Rocktäschel以及Nantas Nardelli,自从看到GPT-2就一直想方设法让这个AI写代码。
求仁得仁,没想到GPT-2真给写出来了。
Tim Rocktäschel赶紧发推特说,人类有麻烦了……
不过,上述种种GPT-2写的代码都不是很严谨。Nantas Nardelli也补充说,他俩尝试过很多次,贴出来的这次只是效果最好的一次,而且这个AI写代码,似乎很容易把js、C 、Python等语言混到一起写。
当然,这里还有个问题。
就是大家尝试的模型,都是OpenAI放出的缩小版模型,参数只有1.17亿个参数。也许使用完整版的GPT-2,AI能够写出更漂亮的代码。
完整版和缩小版差距有那么大么?
有的。
MIT Tech Review的作者will knight试用GPT-2写了一个故事。他在开头给了一句话:猫和企鹅起了争执(The cat and the penguin had an argument),然后剩下的故事就是AI自己编写完成,包括它们因为一片面包起争执,还打起来云云。
GPT-2编的有模有样。
不过,有人用OpenAI放出来的模型试了一下,发现同样的开头,故事却编的奇奇怪怪、不成样子,完全不知所云的感觉。
最后大家一讨论,明白了:
原来那个有模有样的故事,用的完整版是用15亿参数的完整版GPT-2生成的,而不知所云的故事,使用缩小版GPT-2生成的。
差距真的很明显。
还记得昨天OpenAI怎么说的么?GPT-2太厉害了,我们不敢放出完整模型。结果大家要想试用,只能得到不厉害的结果。
也正是OpenAI这个言论,引发一堆网友疯狂吐槽。
这两天在reddit上,有两个高赞的讨论。
有一个网友说,我训练了一个23064层的ResNet,在MNIST上的准确率达到99.6%,我该把这个模型分享出来么?我有点害怕它被恶意使用。
嗯,这么明显的指桑骂槐,大家一看就知道在说谁。
还有更明显的。
另一个网友说,OpenAI是不是该改名了,我看叫ClosedAI吧。
:)
作者系网易新闻·网易号“各有态度”签约作者
— 完 —