作为最成功的人工智能驱动的应用之一,推荐系统通过在我们生活的许多方面提供个性化的建议,帮助人们以有效和高效的方式做出适当的决定,特别是针对各种在线服务,如电子商务平台和社交媒体网站。在过去的几十年里,推荐系统的快速发展通过创造经济价值、节省时间和精力以及促进社会公益,使人们大大受益。
然而,最近的研究发现,数据驱动的推荐系统会给用户和社会带来严重的威胁,比如在社交网站上传播假新闻以操纵舆论,在求职服务中放大对少数群体或个人的不公平,或者从推荐结果中推断出隐私信息。因此,为了减轻推荐系统带来的负面影响,推荐系统的可信任度越来越受到各方面的关注,从而提高公众对推荐系统技术的信任。
链接:https://arxiv.org/abs/2209.10117
在本文所介绍的综述中,其对可信推荐系统(TRec)进行了全面的概述,并特别关注六个最重要的方面;即安全和鲁棒性、非歧视和公平性、可解释性、隐私性、环境友好以及问责与审计。对于每个方面,其总结了最近的相关技术,并讨论了潜在的研究方向,以帮助实现真正的可信推荐系统。
以金融应用中的推荐系统为例,它在各种高风险的场景中发挥着至关重要的作用,如股票市场、保险产品和贷款服务。因此,在任何潜在的安全威胁下,推荐系统都要做出特别稳健和准确的决定。同时,客户的人口属性,如收入、职业、种族和性别都是非常隐私的,这就要求推荐系统避免泄漏用户隐私。因此,这些信息需要在推荐系统中得到特殊和仔细的保护。此外,重要的是,推荐算法应该减少对某些群体或个人在信用卡和贷款审批方面的歧视性偏见或不公平。另外,考虑到推荐系统的可靠性,我们希望为不同的利益相关者提供关于某些决定是如何做出合理的解释,并定期从不同的方面进行系统审计。此外,训练和微调一个大规模的推荐模型通常需要巨大的能源和自然资源,导致全球环境恶化和资源枯竭的问题。因此,为了我们后代的利益,考虑推荐系统的可持续性和环境友好性是非常重要的。
最近,学术界和工业界对推荐系统的可信赖性有了越来越多的认识,促成了大量文献的出现,其强调了可信推荐系统的各个层面。例如,为了抵御对抗性攻击,人们提出了有关鲁棒推荐算法的方法,比如ABPR: 利用对抗训练技术增强的BPR。为建立公平的推荐系统,已经为各种现实世界的任务(如在线工作匹配)设计了去偏技术,比如综述 | 推荐系统偏差与去偏总结。人们已经提出了可解释推荐算法,以提高推荐决策过程中的透明度和用户满意度。人们还探索了保护隐私的技术来减少隐私数据泄漏的风险,比如基于对抗学习的隐私保护推荐算法。
作为以人为本的人工智能系统最成功的应用之一,系统地总结可信推荐系统的现有成就和挑战是非常必要的。因此,在本文综述中,其对可信推荐系统(TRec)进行了全面的概述,以帮助研究人员和从业人员对可信推荐系统有一个基本的了解,然后深入了解最新的进展,并促进对这一课题未来方向的讨论。更具体地说,本调查介绍了实现可信推荐系统的六个关键维度。对于每一个维度都介绍了它的概念和定义,并提供了一个分类法来综述代表性的和最先进的算法。值得注意的是,对于建立可信的推荐系统,这六个维度并不是相互独立的。最后,还讨论了不同维度之间的潜在交叉以及其他潜在的方面,以便在未来的方向上实现推荐系统的可信性。
安全和鲁棒性
首先,本文介绍了安全和鲁棒性的维度,即对抗性攻击和防御方面,其中要求推荐系统对对抗性扰动具有鲁棒性,从而做出可靠的推荐结果。最近的工作表明,深度推荐系统可以通过产生小的输入扰动来继承深度模型的脆弱性。这种脆弱性引起了人们对在金融和医疗等安全关键领域采用推荐系统的极大关注。因此,研究安全性和鲁棒性以建立安全可靠的推荐系统是非常迫切和必要的。
非歧视和公平性
由于大多数推荐模型是由我们人类设计的,并根据用户行为数据进行训练,推荐系统很容易继承人类对某些群体或个人的歧视和不公平,从而导致各利益相关者的信任损失。最近,推荐系统的非歧视性和公平性受到学术界和工业界的广泛关注。本文详细介绍了非歧视和公平的维度,并介绍了预处理、处理中以及处理后过程的公平性问题。
可解释性
随后,本文介绍了可解释性的问题,它希望推荐系统在预测背后的工作机制能够被不同的利益相关者(如系统的开发者和终端用户)所理解。推荐系统中的可解释性被视为激励用户与在线服务互动的有效方式,在互动过程中增加用户的信任,并帮助算法开发者开发和调试系统,在文中给出了详细的介绍。
隐私性
由于大多数现代推荐系统是由数据驱动的,最近的工作发现,用户的隐私数据,如浏览历史和信用卡号码很可能被非法存储和暴露,这增加了数据泄漏的风险。在本文中,其详细介绍了隐私这个概念,它要求推荐系统防止任何私人信息被泄露,具体介绍了攻击类型以及防御机制。
环境友好
现代推荐系统严重依赖深度学习技术来实现出色的推荐性能,其中对大型推荐模型的需求将不断增加,导致训练时间过长,存储空间大,能耗巨大。最近的一项研究表明,在淘宝数据集上训练一个模型需要621分钟,使用4个GPU,其平均GPU功耗为每小时56.39W。本文提出了 "环境友好 "这一维度,它期望一个推荐系统可以是可持续的和环境友好的。
问责和审计
最后,本文讨论了可审计性和可问责性的维度,它期望在推荐系统的实现中,可以明确确定许多不同方面的责任分配。
读者对其中哪一部分感兴趣,可阅读原论文。