来源:At scale 主讲人:Andrew Jenks 内容整理:张雨虹 伴随着恶意合成媒体(包括深度伪造和廉价伪造)的越来越多,用户区分真实媒体和不真实媒体的能力已大大降低,逐渐失去对媒体的信任。本次演讲者 Andrew Jenks 来自于微软媒体安全团队,其有着 10 年的媒体安全工作经验,其演讲内容将涵盖合成媒体在视频生态系统中的危险、打击恶意合成媒体的方法,以及如何利用媒体来源技术(Media Provenance)向最终用户提供媒体信任信号。
目录
- 背景
- 恶意合成媒体
- 验证受信任的来源
- 解决措施
- 主要组织机构
背景
在过去的一年,恶意合成媒体的的数目越来越多,逐步发展到了无法想象的地步,因此解决恶意合成媒体问题迫在眉睫。
媒体造假并不是一个新问题,其存在时间几乎和媒体本身一样长。但是伴随着处理工具的更便宜、更容易获得,媒体造假也越来越广泛,甚至也从静止图像扩展到了视频。
工具的民主化给了投机取巧之人可乘之机。深度伪造逐渐占据了所有的头条,这其中这不仅是合成媒体,而且不仅仅是深度伪造。当然合成媒体也可以对人们的生活产生积极影响。比如我们可以使用合成媒体为视频添加听力受损者的字,我们可以玩像 Wombo 这样的有趣应用。但有些为了伤害而建立的不顾任何形式的合成媒体是有害的。
恶意合成媒体
深度伪造(Deep Fakes)是一种恶意合成媒体。他们使用更复杂的技术来生成更好的图像,但是所有形式的恶意合成媒体都是可能存在问题的。当然恶意合成媒体不仅包括深度伪造,还包括廉价伪造和内容重用。Nancy Pelosi 的视频就是一个廉价伪造的例子,相较于原始视频只是稍微慢下来,一个微不足道的改动。Mark Zuckerberg 的视频是一个真正的深度伪造的例子。他的嘴唇被编辑和替换,并插入了一条新的音轨,让他说一些奇怪的话。当这段视频发布时,它对 Facebook 的股价产生了重大影响。
验证受信任的来源
验证受信任的来源过去很容易。比如没有人伪造送到你家门口的《纽约时报》或电视广播,因为这很难,你通过 SSL 直接访问 BBC 时,你可以非常确定你正在观看的内容。那么为什么现在这是个问题呢?这实际上与规模和可访问性有关。
首先,制造虚假媒体的能力变得更加容易。其次用户可以比以往更快、更广泛地分发恶意合成媒体。当然,用户现在仍然可以用这些相同的方法,花费几分钟就可以使用像这样的可信来源检查它。但是现在没有人这样做,YouTube、推特、脸书或其他类似的流行社交网站已经成为当今主要的新闻渠道。在英国广播公司的一项研究中,在 Facebook 上观看文章的人数是 BBC 网站上原始文章的 10 倍。这只是一个社交网络上的一篇文章。一旦内容完成这个双跳并开始被转发,就会失去与原始内容的任何链接。你不可能知道你看到的是否和最初出版的是一样的。任何有许多途径的媒体都可以重新发布,这是一个规模问题。互联网时代的规模是一个普遍的问题。因此,最终的结果是将检测社交网络和其他渠道上的图像和视频真实性问题留给最终用户。但是大多数人们不相信自己有能力判断一条新闻是真是假。因此只有 35% 的人信任他们在社交媒体上看到的新闻或信息。同时一条新闻在被新新闻取代之前只能在公众视野中停留大约 72 小时,这意味着在造成损害之前,你只有几个小时的时间来影响虚假报道,而且在社交网络上观看视频的人往往比在其他渠道观看的内容少。因此可能会忽略媒体可能被伪造的重要线索。
以上这些对你、对社会、对企业、对民主进程、对新闻业来说都是一个大问题。人们正在对以前信任的消息来源失去信心。事实证明,当世界上有一定数量的虚假信息时。人们开始越来越不相信真实的信息,这被称为骗子红利。但归根结底,当任何东西都可能是假的,而你却分辨不出区别时,你不能确定什么是真什么是假时,这直接伤害了你与现实的关系。
解决措施
因此我们可以采取一些措施更理性、客观地对待媒体。我们在看新闻之前先问问自己它是从哪儿来的以及如何核实消息来源;我们可以在平台上制定新的政策来帮助保护用户;我们可以通过法律,与立法者讨论在线环境中的虚假信息问题。更要的是我们也可以开发和部署技术解决方案。
三个关键技术
考虑恶意合成媒体的技术解决方案时,有三个关键点:检测、身份验证、出处。检测是自动判断媒体是否是假的能力;身份验证是判断某物是否来自可信来源的能力;出处是获取有关附加信息的能力。做出是否信任它的更有教育意义的决定。
检测技术
检测是一个比较活跃的研究领域。在过去的几年里,已经开发了许多技术来尝试判断图像或视频是否已被篡改,如上图所示。包括 Facebook 在内的主要科技公司正在引领开发新技术来检测合成媒体。
检测技术的问题
检测的问题实质是这也是一场军备竞赛。当你有一个好的检测器并将其连接到恶意合成媒体生成器上时,你也可以训练生成器来制作恶意合成视频骗过检测器。目前最好的人工智能探测器也只有 60% 到 75% 的能力,这意味着他们错过了四分之一的信息。如果检测不能发挥作用,这又回到了骗子红利的怪圈,当不能确定检测结果时很容易伤害最终用户信任媒体的能力。因此,我们认为,虽然检测是一个有用和必要的工具,但是它没有完全解决环境中恶意合成媒体的问题。
媒体来源技术
媒体来源(Media Provenance) 是另一种可以利用的技术,它提供了关于您正在消费的媒体的附加信息。这些信息可以是任何东西。希望从作品的标题到对图像执行的完整编辑列表等数据都绑定到相应媒体;它也可以通过签名进行身份验证,以便知道是谁添加的;如果需要,在单个介质中可以有多个来源。这些链接在一起,构成一条信任链,一路回到原始相机起点。这种数据也不需要新的媒体格式,它只是提供了一种新的帮助能力,帮助最终用户评估他们看到的媒体是否存在。
来源数据与元数据一起出现,我们称之为清单(manifest)。对于给定的媒体,可能有一个或多个清单,该清单通过散列以加密方式绑定到实际媒体内容上。这是一种将数字内容与出处数据联系起来的方式,因此不良行为者无法在不破坏出处数据的情况下更改内容。同时清单也由清单创建者签名,保证了在生产过程中将操作绑定到发布者的机制。当用户验证出处清单时,可以确保清单中的信息是发布者放在那里的,并且实际内容在到达用户端时没有被编辑。
清单构成
清单有四个部分,首先是资产指纹;然后是元数据,例如,它可能包含会话标题、作者名字以及提交日期。它也可以不必包含编辑;当然如果您从原始图像开始并对其进行 Photoshop 处理,可以添加该信息,以便人们获得可以进行追踪;最后是数字签名,将其链接回显示特定证书的信息。
签名采用加密结构,这意味着消费者可以生产签名者的真实性。该系统与众所周知的加密过程一样强大,最终用户或用户代理可以对视频进行验证,以确保其自发布以来保持不变。它可以直接绑定到常见的媒体格式,不会破坏当今存在的任何媒体架构体系。单纯的加法操作,而非新媒体业态。
主要组织机构
媒体来源是一个积极研发的领域。有三个组织在负责媒体来源研究:Project Orign、Content Authenticity Initiative 以及 The Coalition for Content Provenance and Authentication。
Project Orign 是基于 BBC、纽约时报 CBC 和微软之间的高层对话形成的。由于媒体中深度伪造的增多,它开始尝试寻找技术解决方案。它特别关注从生产点到消费点的媒体篡改。同时他们还致力于研究 Adobe 主要内容的真实性。在相机上拍摄图像有点像生产点。通过编辑,就在一个稍微不同的问题空间里了。因此,从捕获点到编辑制作再到最终用户,以及静止图像和视频,这些要素聚在一起,使得内容可能有更多的用途。他们决定优先考虑标准的单一互操作解决方案,该解决方案正在 C2PA 中构建。
关系架构
上图显示了组织之间以及更广泛的行业之间的关系。Aion Orign 与其他公司、学术研究人员合作收集要求,然后提供给 C2PA。C2PA 将这些信息转化为可以实施的技术标准并公开发布这些规范,然后 Aion Origin 来扩展吸收这些规范并提供最佳实践和参考实施。
云提供商和社交网络可以使用支持媒体来源的工具向最终用户发布媒体,最终用户将能够知道媒体来自哪里并获得更多信息。C2PA 是为了创建技术规范和标准而开发的,以确保各种生态系统参与者能够和谐共处。
C2PA 是一个非常透明的组织,它公开发布其章程和指导原则,并于 9 月 C2PA 发布了规范草案以征求公众意见,鼓励公众审查和反馈,以建立尽可能高质量的规范。更多信息可以访问http://c2pa.org。
启用媒体来源是一个生态系统范围的问题,它需要一个生态系统范围的解决方案来启用。C2PA 由广泛的合作伙伴组成,成员包括新闻媒体组织、技术提供商、云服务提供商以及社交网络。
合成媒体是一个日益严重的大问题,随着时间的推移,它会越来越严重。在认证可信来源方面我们需要新工具以及新的思维方式。各种机构共同努力,为媒体来源制定了一种可互操作的方法,该解决方案正在 C2PA 中逐渐标准化。由于来源跨场景的广泛性,而信任是一种普遍的需求,我们希望一个通用的技术解决方案来解决这些问题。
附上演讲视频:
http://mpvideo.qpic.cn/0bc37iaa2aaataamit4ewjrfb6wdbx5aadia.f10002.mp4?dis_k=580cbd7e7769a4610cc6afde43a77138&dis_t=1653461342&vid=wxv_2403792596616970243&format_id=10002&support_redirect=0&mmversion=false