一
报告导读
本次报告主要介绍智能写作前沿技术和应用,从内容创作、智能辅助写作助手、机器翻译等方面展开,介绍了智能写作在写稿机器人、赛事解说、智能广告文案、社会公益、经济扶贫等具体场景中的应用案例,对智能写作目前研究上的主要进展和面临的挑战进行了总结概括。
二
专家介绍
李磊博士,字节跳动人工智能实验室总监、资深科学家,原百度美国深度学习实验室少帅科学家。在机器学习、数据挖掘和自然语言理解领域于国际顶级学术会议发表论文40余篇,拥有三项美国技术发明专利。多次担任国际顶级学术会议的联合主席及程序委员等。主要从事机器学习、数据挖掘和自然语言理解领域的研究。
三
报告内容
为什么做智能写作呢?先看看每个人每天花多少时间在写文字上。比如写一篇文章、写Email。曾经有个笑话说,一个博士生、研究生回老板的eMail,平均每封要花一天半的时间,花很长时间构思,所以写作非常重要。写作当中的核心算法问题是什么呢?就是通过算法生成文本,使得这些文本像人写出来的文字,必须是自然的文字。另外一点,它需要满足一定的条件,比如要表达一定的意思或者某些关键词必须出现在里面,或者某些知识点必须出现在里面,我后面会介绍如何用技术实现这两点。
我们看一下写作技术为什么重要?有几个方面的应用:第一是内容的创作,比如自动写新闻,自动编辑文档,生成故事、小说、对话等。第二点是智能辅助写作助手,它可以帮助人去写作,你写前两个字,会把后面一句话补全。另外还有机器翻译,因为它们跟写作技术用的是同一个技术。机器翻译在跨语言的文化交流里面,是非常重要的技术。
对研究员来说,这是我们非常想去实现的一点,未来某一天,研究者、学生,只需要跑一下实验,这个实验报告或者论文可以让算法自动生成,当然现在还没有实现。但是现在已经实现了什么呢?在媒体当中,已经出现了一系列写稿机器人,比如腾讯的Dreamwriter,新华社的“快笔小新”,字节跳动设计的“小明”机器人,都有对应的写稿机器人可以写不同题材的文章。
这是“小明”写稿机器人写出来的文章,在去年世界杯的时候写的足球比赛,当然它不仅可以写中文,可以支持6个语种,支持17个比赛。当然不光是体育比赛,它还可以写其它题材,像财经类的,还有其它的稿件。这是一个demo的例子,如何利用视觉信息、多模态的信息,利用数据自动写出一个赛事的报道,这个算法会得到比赛的数据、球员的信息、布阵的信息,重要的关键点,像红黄牌等,根据这些重要的信息生成稿件。
我们做得最近的一个工作,不光要写这个比赛报道,还要解说,解说更难,我们这里做的是斯诺克的解说,也是用计算机视觉的技术识别球台、球形和球的走位。不光做解说,还要做预测,要告诉观众说这个球员下一杆会击打哪个球,利用大数据和机器学习预测球员下一杆击球的策略,根据这些生成对应的解说文字。
当然了,我们还可以把同样的技术运用到更有商业价值的文稿生成,像算法生成广告文案,通过文本理解到底卖什么商品,它的特点是什么,根据这些生成广告文案帮助中小企业设计更好的广告。智能文案生成的技术,同样可以是改进搜索体验,在搜索框里面,用户还没有搜索的时候就可以猜它可能搜索什么样的query(查询),把这些query自动生成出来。当然了,我们的生成技术不光可以用来做商业化的生成,还可以做社会公益方面的生成。比如头条有个公益项目是“头条寻人”,寻找走失的人口,在走失人口的附近对所有头条用户发送一条推送消息,这条消息通过算法自动生成,通过这样的方式可以很快地找到走失的人口。通过这个算法,过去三年已经找到超过一万名走失人口。当然,还可以通过写稿技术帮助经济欠发达地区经济扶贫,帮助他们把农产品和特点通过头条和抖音平台卖出去。需要对他们的农产品做一些描述,这些描述的文章可以通过生成算法来自动生成。
但这些问题的背后有很多技术的挑战,过去几年在学术界,也是做了非常多的工作。包括像贝叶斯的方法,如何做文本的生成。文本表示的方法,如何把语义和语法脱离开来,更好地文本表示,最后做文本生成。如何用对抗的方法做文本生成,以及更好的预训练做文本生成。
当然我们还有很多技术挑战,比如在高维空间里面如何做更好的生成。因为文本和图像不一样,图像是连续的,文本是离散的,而且是比较长的离散空间,在这里面直接搜索是非常困难的。如何做可控的文本生成,这个可控性是非常重要的,我希望这个生成的文本完全满足需求,如何跨模态的生成,有图片、语音,如何生成文字,以及长文本的创作当中,如何生成比较一致性的文字。最后我认为最难的问题是创造性的生成,原先没有的,像诗歌、小说,要给它做一些创造性的方案出来,这个是非常困难的。