谷歌NeurIPS 2018:全新NLP工具炼成会改变文风的AI

2018-12-26 11:12:29 浏览数 (1)


新智元报道

来源:Venturebeat

编辑:大明

【新智元导读】本文总结了2018年下半年,最火的开源框架、模型,以及社区。同时还提到一个有趣的现象,每20分钟就有一篇AI论文现世。最后作者为新智元读者推荐3本经典深度学习教程。

代笔们,枪手们,小心了!会改文风的AI来了!

日前,在加拿大蒙特利尔举办的AI顶会NeurIPS 2018上,来自密歇根大学和谷歌大脑的研究人员提出了一种新的面向NLP任务的机器学习新架构,不仅能够根据给定的实例生成句子,而且能够在保留句子意思的情况下,改变句子表达的感情、时态、复杂度等属性。

论文链接:

https://papers.nips.cc/paper/7757-content-preserving-text-generation-with-attribute-controls.pdf

研究人员称,这一技术有望可能用于多种用途,比如复述、小组会议、机器翻译、对话系统等。该系统可以作为今年前不久微软推出的NLP弱结构关系推理工具的有力补充。

研究人员表示,“我们通过本文解决了对句子属性的修改问题,在无需平行数据的情况下首次成功对句子的多个属性进行了修改。”

本文中介绍的AI系统可以改变句子的感情色彩,即褒贬义、正负面感情色彩的改变。数据集来自Yelp用户点评内容和IMDB影片评论

该团队首先解决感情控制问题。研究数据基于两大用户生成的文本数据集:点评应用Yelp评论数据集的过滤版本,以及IMDB网站上的大量电影评论进行,这两个数据集的句子数量分别达到44.7万和30万,用于训练系统。

在训练之后,研究人员使用12.8万条Yelp餐厅评论和3.6万条IMDB电影评论的测试数据集,尝试从具有负面情绪的句子中生成具有正面情绪的文本片段,反之亦然。

BLEU是评估机器翻译文本质量的标准化指标,本文中提出的AI系统在BLEU评估中的表现胜过了两种当前效果最好的文本生成方法。

此外,这个系统始终能够生成与输入句子相关的、语法正确的句子。在某种程度上,参与亚马逊Mechanical Turk项目的人认为模型生成的输出比以前的方法得到的输出的真实度更高。

该模型生成的句子非常连贯自然。比如,它将“柜台后面的人并不友好”转换成了“柜台上的人非常友好和乐于助人。”在另一个例子中,该模型把“这是关于这部电影,还有一个有趣的方面”,变成了这部电影“没有值得关注的质量”。

令人更加印象深刻的是,另一项测试中的研究人员使用该系统同时控制句子的多种属性,包括情绪,时态,声音和情绪等。在对多伦多BookCorpus数据集的200万个文本片段的数据集进行训练之后,模型能够将将来时句子中的指示性情绪(“John将无法住在营地里”),转换为条件时态中的虚拟语气(“John不能住在营地“)。

如上图所示,系统可以同时修改输入句子的多个属性,如感情、时态、主动/被动式以及肯定/否定等

研究人员表示,“本文表明,我们的转换模型通过各种实验和指标有效地反映了条件信息。以前的成果主要是关于句子单个属性的控制,并在两种模式之间进行转换,本文中的模型应用很容易扩展到多属性的转换场景。在这个框架下,未来方向是转换句子红具有连续值的属性,以及范围更大的语义和句法属性。“

量度标准与实验结果

表1:情感条件句子生成的定量评估。 属性兼容性表示生成的句子的标签的准确性,由预训练后的分类器来量度。句子内容的保留程度由(BLEU-1(B-1)和BLEU-4(B-4)分数)评估。 根据预训练的分类器量度生成“困惑度”指标,来评估输出句子的流畅度。 对于准确性和内容兼容性指标,数值越高更好,对于困惑度,数字越低越好。

表2:对于模型生成的句子的人类评估结果。 表中数字分数表示由真人判断为具有适当属性标签和内容的句子占输出的百分比。流利度评分采用5分制

表3:将古英语翻译成现代英语的示例。表中seq2seq模型受并行数据监控。研究人员在无监督(无并行数据)和半监督(成对和不成对数据)条件下对模型进行测试

参考链接:

https://venturebeat.com/2018/12/05/googles-ai-can-change-the-mood-voice-tense-and-sentiment-of-sentences/

论文:

https://papers.nips.cc/paper/7757-content-preserving-text-generation-with-attribute-controls.pdf

0 人点赞