人工智能在传媒领域的实践已从最初的数据搜集,延展到内容生产、渠道分发等各环节。未来,在传媒业,人工智能可能取代人力吗,它会给这个行业带来哪些改变和影响?
作者 方曦
来源 视听界
机器人也来写稿了,媒体记者、编辑的饭碗还端得稳吗?一时间,出现各种讨论、担忧。事实上,不止写稿,人工智能在传媒领域的实践早已从最初的数据搜集,延展到内容生产、渠道分发等环节。智媒时代,人工智能可能取代人力吗?我们先来看一下人工智能在目前媒体中的应用:
写稿机器人
机器人写稿,被认为是人工智能在传媒业的颠覆式创新。美联社有“Wordsmith”、《华盛顿邮报》有“Heliograf”、新华社有“快笔小新”、腾讯有“Dreamwriter”、今日头条有“张小明”……全球媒体纷纷推出自家的写稿机器人。机器人是如何写稿的,稿件质量怎么样?我们来做个盘点。
1.格式化的财经、赛事消息
这是机器人写稿目前最常应用的领域。以美联社为例,2014年7月,美联社与一家科技公司达成协议,使用对方的Wordsmith平台自动编发企业财报。三个月后,这套人工智能系统通过算法学习,掌握了新闻写作的基本规范,平均每个季度能生成4000篇左右财报。2015年,美联社将Wordsmith的应用范围扩大到体育板块,并透露,下一步还要开发算法,争取将文字消息自动转换成广播音频。
在国内,擅长写这类消息的机器人代表有新华社的“快笔小新”和今日头条的“张小明”。“快笔小新”现供职于新华社经济信息部、体育部以及《中国证券报》。机如其名,无论是一句话报盘,还是长篇大论的公司财报,人类记者花几十分钟甚至几个小时才能写就的稿子,“快笔小新”分分钟就能生成若干篇。
“快笔小新”
今日头条的“张小明”更加专注体育圈。里约奥运会开赛一周,“张小明”6天生成200多篇稿件,平均每天出稿三四十篇。有业内人士评价,高产还不是它的最大优点。“张小明”上岗的更大意义在于,它能一场不落地关注奥运赛场上所有设定需要它关注的比赛。这些比赛有些是常人眼中的冷门项目,但从反馈来看,用户关注度并不低。换句话说,“张小明”的出现,弥补了媒体人手有限的短板,触发的长尾效应出乎意料地显著。
“张小明”写的稿件
2.大数据解读稿
擅长撰写这类稿件的机器人代表是微软中国研发的“小冰”。近一两年,“小冰”频繁亮相,先后担任过东方卫视早间新闻主播、中国教育电视台选角导演、优酷自频道人工智能主播等。如今,它的新身份是《钱江晚报》特约记者,在报社APP“浙江24小时”设有专栏。
“小冰”的数据处理、分析能力很强,加上有微软必应搜索大数据支撑,它能轻松捕捉用户兴趣点。常态工作中,它会以“一个标题、一幅图片、一段概要、两种观点”的形式,自动抓取热点事件,罗列交锋观点,邀请网友互动点评。它还会不定期地推出数据解读稿。比如2017年春节后推出的作品《全国烹鸡地图来了,哪种“鸡”征服了你的味蕾》,这是一篇基于大数据,盘点国人吃鸡喜好的策划报道。由编辑确定选题,工程师定制模板、研发算法,“小冰”自动分析生成。文章梳理了8道最受人们欢迎、以鸡为食材的过节菜肴,又根据南北差异,绘制了一幅栩栩如生的全国“鸡菜”地图,选择在春节刚过完上线,应景又生动。
和其他机器人一样,“小冰”也会写一些文体赛事类消息。所不同的是,它的预测能力惊人,成功预测过的赛事包括:格莱美奖、奥斯卡奖,还有多场NBA比赛。准确度之所以如此之高,源于“小冰”具备了将学习模型用于全网数据的分析能力,即依赖大数据。
聊天机器人
要说和机器人聊天,估计大家最先想到的是苹果Siri。其实,不止苹果这类科技公司,很多新闻机构也在抢占聊天机器人的新风口。聊天机器人具备更强的关键词识别能力,在人机互动的过程中,它们会将用户使用过的关键词搜集反馈到数据库,经由勾勒、复刻用户画像,精准定位、定向推送,由此实现产品分发渠道的优化。
今年4月,Facebook在F8开发者大会上宣布,聊天机器人“Chatbot”上线。Facebook Messenger向开发者开放,它将助力媒体实现人机对话。很快,包括美国有线电视新闻网CNN、英国《卫报》在内的传媒巨头纷纷试水。
CNN的聊天机器人每天会向用户定点推送头条新闻。每条推送下方,都有三个选项:阅读全文、获知梗概、向CNN提问。只要提问,机器人就会自动捕捉问题关键词,分析比对后,为用户推送匹配的资讯。英国《卫报》的美食机器人“Sous-Chef”则有教人做菜的本领。但凡有想吃却不会烧的菜,咨询“Sous-Chef”,它就会根据食材、做法等关键词,为用户定制菜谱推送。
虚拟编辑
全天自采新闻多,有哪些更适合上社交平台呈现?美国《纽时时报》虚拟编辑“Blossomblot”解决这个问题很拿手。“Blossomblot”每天会过滤社交平台上的海量文章,并根据大数据预判,筛选出大家最感兴趣的内容,优先推荐。来自报社内部的统计显示,经由“Blossomblot”筛选后自动推荐的文章,点击量是普通文章的38倍。
英国机构Full Fact去年研发出一款新闻自动核查校对程序。它能从几十家英国新闻网站上搜寻信息,一旦发现网络谣言,就会澄清、粉碎它们。项目负责人自信,不久的将来,事实核查所经的各个环节都将实现智能化。
人工智能会取代记者编辑吗?
机器人出稿有多快?腾讯机器人“Dream Writer”一天能写超过2000篇财经科技类稿件、500篇体育类稿件。第一财经的“DT稿王”,一秒能写28个字,一分钟就是1680个字。美联社机器人“Wordsmith”一个季度能出4000篇左右公司财报。如此高产高效,的确非人力所能及。
人工智能在传媒领域的实践有多火?以国内媒体为例,据不完全统计,仅今年全国两会期间,从中央到地方,就有12家媒体推出了15款智能机器人。从终端形式看,推出实体机器人的媒体有5家,推出虚拟机器人的有5家,两者兼有的2家。
如此蓬勃的发展势头,不由让人疑惑:会有那么一天,人类记者、编辑被机器人取代吗?事实上,类似的担心在人工智能付诸实践的若干领域都在不断被讨论。这些担心并非空穴来风。高盛集团去年在一篇调查报告提到:“当下,人工智能带来的自动化及效率提升在各领域都缩减了约 0.5%-1.5%的劳动工时”。这意味着,今后,越是低附加值领域,人工智能取代人类的可能性就越大。只是,在传媒领域,下这种担心的结论为时尚早。
人工智能实践暂时离不开人为干预
一个显而易见的事实是:至少目前,机器人参与的所有媒体实践都离不开人为干预,因为它所依赖的算法、模板、大数据,短期内都离不开人。
自动成稿需要人为干预。现阶段,机器人成稿快是优点,但行文格式单一、可读性差,也是回避不了的硬伤。对照出稿流程,按需定制的新闻模板决定了成稿框架;用户的参与热度左右了大数据体量;技术人员开发算法的水平,影响到出稿准确度。有鉴于此,机器人写稿的应用范围才会更多集中在需要数字说话的财报、赛事领域。其他需要深入采访,或者强调个性化表达的调查报道、评论、访谈类体裁,短期内机器人还不能胜任。
深度学习依赖人为干预。人机互动,不仅仅是人与机器聊天,优化分发渠道、定制推送产品的过程,也是机器人充实大数据、深度学习的过程。通常,研究人员需要花几年时间来确定目标对象的属性、特征,搭建重点模型,再通过算法、代码,帮助机器人理解模型。之后,在人机互动的过程中,机器会自动搜集、比对、标记接收到的数据,并根据优先级,做出针对性的吸纳、学习。经过这个过程,机器的图像识别能力和语音辨别能力会呈几何级提升,并且理论上,它接触到的数据越多,就越聪明。一个影响很广的例子,就是谷歌公司的智能围棋程序“AlphaGo”。它与人类棋手交锋越多,就越熟悉人类的出棋套路,针对性地见招拆招。
了解其原理,不难发现,机器人深度学习,起码有两方面依赖人为干预。一是研发人员的前端准备,后端跟进、监控,这个过程需要程序人员不断设计完善算法、模型;一是用户反馈。反馈数据决定了数据库的体量和质量,数据有效性越高,机器的智能化水平就越高。反之,则会导致机器人黑化,通俗的说法,就是机器人学坏了。
典型的例子是微软聊天机器人“Tay”。初次亮相时,“Tay”表现得彬彬有礼。然而上线仅仅24小时,它在和人互动时就爆了粗口,甚至屡屡发出涉及种族主义的不当言论。在做出紧急下线“Tay”决定的同时,微软方面也无奈地表示,“Tay”学习能力很强,它有将搜集到的信息内化的能力,但却无法辨别信息好坏。由于使用者的不确定性,这种信息照单全收模式,直接导致了“Tay”的“黑化”。如此看来,机器人智能化水平的高低,不仅取决于研发技术,也与使用者的素质休戚相关。打个形象的比方,现阶段,离开了人机互动,机器的初始智能就像一张白纸,在白纸上画什么样的画,则取决于人为干预。
人工智能尚未涉及核心采编业务
客观地说,相比科技企业,媒体还不具备人工智能的开发实力。尽管争先恐后的试水态度值得肯定,但细看之下,目前,除少部分媒体引入人工智能时,有从战略到执行的系统方案外,更多媒体还是在体系内的某个环节做着针对性的有限尝试,并且开发依赖的大数据大多由科技公司提供。比如Facebook开发的Facebook Messenger chat平台。目前在这个平台上有11000多个聊天机器人,专长覆盖了新闻、财务、娱乐、生活等门类,CNN、英国《卫报》的聊天机器人都是基于这个平台。
尽管系统战略、技术平台尚不具备,但行业内盲目跟风,快速上马人工智能项目的现象依然存在。一些媒体推出的所谓黑科技,短暂亮相后,很快销声匿迹。这种应景式的被动应承,自然不会涉及媒体核心采编业务。机器人取代记者、编辑,也就成了无稽之谈。但这种行动过当,却会带来资源浪费。
人工智能时代的媒体发展
我们正处在由技术革新推动的行业转型期,智媒时代已然迫近。在可预见的未来,人工智能技术将对媒体生产、传播的方方面面产生深远影响。新技术更新迭代快马加鞭,传统媒体无法视若无睹,更不可能置身事外。顺应发展,必须采取“升维”思路,变“传统互联网思维”为“人工智能思维”,站在战略高度,将“Think Mobile”(移动思维)转换为“Think AI”(智能思维),探索尝试“内容 技术 市场”的全产业链运营。
强化阵地意识,
构建人机协作的互补共生体系
媒体人应谨记,无论人工智能如何发展,机器,只能是辅助人力的高效工具;人,才是新闻生产和传播的主体。
当前,行业内对发展人工智能存在两种非理性状态:一是一哄而上的跟风炒作,二是过分保守、观望。必须承认,机器在数据处理、分析、核查等方面的效率确实比人高。理性看待它的发展,强化阵地意识,不盲从、不回避、不慌张,积极构建人机协作的互补共生体系,将是未来一段时期,媒体转型升级的大势所趋。
人工智能辅助数据处理。从生产端到分发端,稳扎稳打、合理安排人工智能辅助作业,将能极大提升效率、节约成本、解放人力,让更多编辑、记者有时间、有精力去创作富有温度的作品。
人工智能辅助内容呈现。这几年,VR(虚拟现实)、AR(增强现实)、H5技术日渐成为媒体新宠。几乎每隔一段时间,行业内就会出现现象级的爆款产品。比如,人民日报客户端H5产品《快看呐!这是我的军装照》、江苏卫视跨年演唱会360°全景体验式VR直播、腾讯与故宫合作推出的“Next Idea × 故宫”文创系列……新技术加持包装的媒体产品,呈现方式灵活、用户体验新鲜,契合智媒时代多元化的受众需求。
储备力量,
打造“全媒体记者 算法工程师”
大数据是人工智能发展的基础和前提。未来,谁拥有的数据量越大、质量越高,谁就越能占据高点,掌握发展主动权。当前,传统媒体正处在向纵深融合发展的关键期,行业转型升级势在必行,对从业人员的要求,也从最早的熟练掌握采编业务,提升到兼具图片、音频、视频处理能力,灵活对接全媒体平台等。
媒体需要复合型人才,更需要复合型的人才队伍。如果说全媒体记者和互联网用户为大数据采集提供了取样支撑,那么“算法工程师”则是赋予机器深度学习能力的灵魂人物。他们运用数学和计算机知识,搭建模型、设计算法,训练机器人采集、分析数据,深度学习,不断提升业务水平。去年,“今日头条”远赴美国硅谷招兵买马,开出百万高薪招募资深算法构架师。在可预见的未来,这种对技术人才的重视和培养或将成为主流。尽早打造“全媒体记者 算法工程师”的人才高地,夯实发展人工智能的底气,抢得先机。
融合传播,
善用用户大数据,发展平台型媒体
以往,传统媒体大多是单一的线性传播,受众的个性化选择被忽视。智媒时代,以个人为基本单位的传播能量被激活。发展平台型媒体,意味着打通传统媒体与互联网的连接。在这个开放的平台上,平台自身就是一个信息传播共同体。受众既是媒体产品的用户,也是人机交互的内容生产者和传播者。人与人、人与机器,在一次次协同互动中完成用户数据的积累、聚合。大数据体量、质量直接影响到算法的实现程度。平台型媒体集纳的人气越多,就意味着用户数据采样越多,科学取用,再经深度算法学习,就能帮助人工智能系统快速迭代,升级进化,继而进入人机互动体验升级、用户黏性升级、大数据升级、算法升级,人工智能升级的良性循环。
(全文见《视听界》2017年11月刊)