网红AI教师Siraj Raval彻底栽了!剽窃论文遭Jeff Dean等大牛抵制

2019-10-15 22:54:55 浏览数 (1)


新智元报道

来源:Reddit、Twitter等

编辑:肖琴、大明

网红AI研究员、号称拥有 100 万学生的 Siraj Raval,这次彻底栽了。

前不久,Siraj 开设 “用机器学习赚钱” 的课程,被爆出课程质量跟宣传大相径庭,而学员要求退款都被拒绝甚至拉黑,被大举声讨。

Siraj的“网红AI老师”人设一夜崩塌,成了众矢之的,更被扒出许多 “黑料”。

然而,这些声讨对他来说似乎不疼不痒,他继续在Twitter和YouTube上活跃,开课,开直播,发布视频。欧洲航天局(ESA)甚至邀请Siraj作为他们ESAC数据分析和统计研讨会的嘉宾。

但就在这两天,Siraj Raval可能要彻底玩完了:他剽窃了论文

从Twitter到Reddit,从吃瓜群众到Jeff Dean、Ian Goodfellow等AI大牛都谴责他厚颜无耻的行为,推特上发起了一波“取关Siraj”的风波:

"如果你关注了著名的骗子&剽窃者@sirajraval,动动手指取关他!不要给这个无赖任何信誉,这会帮助欺骗他的学生。”

剽窃论文这种行为确实引起众怒,Siraj无法洗白了。接下来,我们看看他是如何剽窃的。

复制粘贴 截图,如此剽窃不可忍

事情是这样,前天,Siraj 在直播中提到他最近写了一篇关于“Neural Qubit”的论文。

很快,ML 工程师Andrew M. Webb发现,Siraj的这篇论文大部分内容剽窃Nathan Killoran、Seth Lloyd以及其他作者的论文。

左边是Killoran et.al 的论文,上传时间是2018年6月;右边是Siraj的论文,上传时间是2019年9月

Webb表示:“我选择公开曝光Siraj的造假行为,因为他有很多粉丝,而且目前有很多付费学生。这些粉丝真的信任这个家伙,我不认为他会改变。”

Siraj的剽窃手段有多么猖狂呢?他仅仅在摘要中引用了Killoran et al.的观点,并表示他提出了一个与之“相似”的模型,但他的论文与Killoran et al.几乎是逐字逐句相同的,甚至连图形、表格和说明文字都一模一样。

有些部分则用毫无意义的“同义词”替代。例如,Killoran et al.的论文中写道:“There is a key distinction in the CV model between the quantum gates which are Gaussian and those which are not.”

Siraj将这句话变了变:“In the CV model, there s a key difference between Gaussian quantum doors and non-Gaussian ones”。

“gate”被替换成“door”了,计算机术语中“Gaussian gate”是一个专有名词,而不理解自己所写内容的Siraj,显然认为“gate”就是“door”的同义词。

这种令人啼笑皆非的替换还不止一处。

Reddit网友评论

另一个毫无意义的同义词,大概是为了隐藏剽窃行为:“complicated Hilbert space”,原文“complex Hilbert space”是一个术语,Siraj用“complicated”替换了“complex”

这是更多剽窃内容。很容易就能找到抄袭的地方,因为他公式的序号都是一样的:他甚至不是自己写一遍公式,而是直接截图粘贴到文档中!

有兴趣的读者可以打开这篇论文看一下,所有的数学公式、图和表格的分辨率都特别低,明显能看出是截图。http://vixra.org/pdf/1909.0060v1.pdf

这是另一页。这部分只是对经典神经网络的描述。Siraj正在运行一个在线课程,有1000多名学生,每人收费200美元,而他甚至连解释经典神经网络都是抄袭的。

还有人指出,Siraj论文中使用的示例应用是一个“欺诈检测”模型,当然,这部分内容也是抄袭的。

论文中没有抄袭Killoran et al.论文的部分,抄袭自Wang et al.的论文“Simulating Cognition with Quantum Computers”(https://arxiv.org/abs/1905.12599)。

可以说这完全是一篇ctrl-C & ctrl-V 截图 一些可笑的同义词替换堆砌出来的论文。

曝光这些剽窃行为的Webb说:“有一件事情我怎么也不明白:如此厚颜无耻的剽窃行为,他(Siraj)怎么会指望能侥幸逃脱惩罚?他以为他的粉丝们形成了一个封闭的社区,不会看到或不会相信这种曝光吗?”

白纸黑字证据确凿,对比图调色盘等石锤一应俱全,这事根本没法洗了。消息曝出后,网友表示,这人已经没救了吧。

我们以为之前的拒绝退款事件之后,这事总不会更坏了,看来还是太天真……

这人论文中的公式都是从原文中复制粘贴出来的,分辨率低不说,连公式的序号都一样。文字就是换了个人称,其他完全一样,这也太省事了吧。我们能不能集体抵制这个人?

这种是真的恶心,让我想起了大学的时候有人做作业时,就用书上的几个截图一拼就提交了。结果长宽比失真,分辨率奇低,或者图片被压缩得不成样子。

事情败露被迫道歉,避重就轻网友不买账

由于事情败露,在社交网络上迅速发酵,Siraj Raval不得不在twitter上发帖道歉,承认为了赶进度而“部分抄袭”,但同时表示他更多考虑的是“能够启发他人的研究”。

现在有人说我的那篇关于神经量子比特的论文有一部分是抄袭的,事实确实如此,我对此表示道歉。我现在每周的计划是发2个视频,所以这篇论文(和视频)是在1周时间内赶出来的。我的目的是希望能够启发他人的研究。今后我会放慢节奏,对出品的内容更加慎重。 4年来,我每周做2-3段教学视频,检测这些内容在社交网络上产生的影响,尽量满足越来越多的观众的需求,对我的精神健康造成了不小的压力。明年我会休息一下,计划用更健康的方式为他人服务。

Siraj Raval还表示,涉事论文和相关视频已经删除。

这两条“道歉”推特发出之后,大部分网友并不买账,他们认为这个态度与其说是道歉,还不如说是在找理由推卸责任,避重就轻,回避实际问题。

首先:

抄袭就是抄袭,什么叫“部分抄袭”?

有人做过对比,这篇文章的抄袭比例将近90%,且大部分都是直接复制粘贴。

有网友简单回顾了Siraj Raval最近的连续不当行为,颇有些翻旧账的意思:

看了这个所谓道歉我更火大了,你知道大家为什么对你这些公关之辞不买账吗? 1、你的注水课程买到200美元的高价,还不给退款 2、你道歉说那篇论文是“部分剽窃” 3、说自己精神健康有问题,工作压力过大,把这些当成之前犯错误的理由 能不能别避重就轻,能不能直截了当地跟那些对你不爽的人坦率交流一下?

你在这条道歉推文上花的时间怕是和那篇论文一样多吧?

还有人抓住了道歉推特中“一周出一篇论文”的字眼,这一看就是惯犯啊,一周抄一篇的节奏?

你一周就能写出一篇论文?大家注意,被他抄袭的这篇论文可能要一个团队的人花上一年多的时间才能写出来,绝不是一个人在一周内就能完成的。

还有赤裸裸嘲讽的:

来,我来翻译一下这个“道歉”:“啊,这次抄袭太明显了,让人发现了,我错了。以后我一定注意不要做的这么明显。”

Siraj是何许人也?

如果你去搜索Siraj Raval,首先出现的肯定是他的个人品牌:他的主页、YouTube、LinkedIn、Twitter、GitHub、medium等等,这些页面把他塑造成一个优秀的、乐于助人、广受好评的“AI传道士”形象。

他自己在 YouTube 频道的自我介绍曾经是 “我被称为计算机科学的 Bill Nye,代码界的 Kanye,神经网络的碧昂丝、学习界的博尔特,Python 界的 Chuck Norris、机器学习界的耶稣……”

大言不惭?

要想真正了解他的背景,就有点难找了。大多数采访他播客和博客都将他描述为“数据科学家、畅销书作家和YouTube明星”。但是他在哪里工作,做什么?他是如何开始制作机器学习视频的?

原来他在休斯顿长大,后来去了哥伦比亚大学。在哥伦比亚大学,他学的第一个专业是金融。在因偷了一台笔记本电脑而被停学一个学期后,他决定“尝试做一些积极的事情”,并改修计算机科学,成为一名软件开发人员。

他在哥伦比亚大学只待了 7 个月就辍学,尽管他声称:“互联网是我的大学,也应该成为你的大学!”

根据他在领英上的介绍,他在纽约的一家机器人公司、Meetup.com、CSB Interactive和Twilio等公司各待了一年左右。他最初的网站上有他在iOS开发方面的工作链接,并自称“软件开发者”。

2016年,他的YouTube频道出现了。这时候他可能还在Twilio工作,职位是“开发者教育家”。所以,他开始走上教学这条路,创造数据科学内容。这时他已经离开大学三年了,是一名开发者,但没有任何数据科学经验。

对于机器学习研究人员、技术人员,以及对于任何拥有当今互联网理性的人来说,我们应该从Siraj Raval身上得到什么教训呢?Vicki Boykis给出了几点建议:

  • 我们需要为人们提供合适的工具和内容,评估他们所观看的技术教学内容;
  • 我们需要尽快结束围绕AI和ML的炒作;
  • 我们需要对所观看和阅读的内容抱有批判的态度(不过这说起来容易做起来难);
  • 如果看到周围有人需要技术支持,我们需要帮助他们,并在这个过程中提高自己的水平。我们需要学会在发一条讽刺性的推特或评论之外,提出建设性的批评。

先是教学视频注水,被发现后拒绝退款,大肆拉黑,现在又是论文抄袭,被逼之下的道歉毫无诚意,避重就轻百般找理由,看来这次这位网红教师这次怕是要凉凉。

0 人点赞