WWW 2022已公布录用论文,接收323篇/投稿1822篇,录用率为17.7%,完整录用论文列表见https://www2022.thewebconf.org/accepted-papers/
本文选择SIGIR'22 搜索推荐多样性方向的论文进行解读。
1. 概述
近年来,国内互联网进入存量时代,野蛮增长不再,在搜索推荐领域,除了传统的点击率、转化率等效率指标的预估,用户体验也逐渐引起各大公司的重视。效率的预估是最大化用户群体,而体验的优化则是友商间更残酷的战场。以电商行业为例,淘宝、京东、拼多多各自有其用户心智,有对应的用户群体喜欢,也伴随着大量的负面评价。谁能够更好地服务用户,谁将在未来的竞争中占据主动。有些体验问题,比如色情图等的治理比较简单粗暴,直接屏蔽降权即可(当然不排除部分APP推荐场景为引流故意擦边球),而点了又推 (很多用户会抱怨,自己点过什么,就疯狂推荐什么)、重复推荐 (比如点了鞋子,满屏都是鞋子)等问题广为诟病,知乎也有个比较火的问题——《推荐系统应该如何保障推荐的多样性?》。提升推荐结果的多样性和发现性,可以有效降低用户疲劳,缓解信息茧房现象 (推荐系统本身的巨大诟病),促进平台的可持续发展。本文选择SIGIR'22 搜索推荐多样性方向的论文进行解读。
2. 对比学习
2.1 DAWAR: Diversity-aware Web APIs Recommendation for Mashup Creation based on Correlation Graph
论文链接:
https://dl.acm.org/doi/pdf/10.1145/3477495.3531962
代码链接:
https://github.com/19801298287/DAWAR
论文机构: 中国农大、麦考瑞大学等
论文分类: (搜索)多样性、APIs推荐
论文总结: 随着微服务架构的日益普及,相当多的企业或组织已经将其复杂的业务服务封装成各种轻量级的功能,并发布了可访问的API (Application Programming Interfaces)。通过关键字搜索,软件开发者可以从海量候选中选择一组API来实现复杂网络应用混合 (mashup,计算机行业术语,在web开发中,mashup是一个web页面或web应用程序,它使用来自多个源的内容来创建单个新服务,并显示在单个图形界面中[1]),大大降低了开发成本。然而,传统的 API 关键字搜索方法往往存在功能兼容性和搜索结果多样性有限等问题,这可能导致 mashup 创建失败和开发效率低下。
为了应对这些挑战,本文提出了一种新颖的多样性感知 Web API 推荐方法 (DAWAR,diversity-aware Web APIs recommendation approach),可以为 mashup 创建找到多样化和兼容的 API。它结合了关键字搜索技术和行列式点过程 (DPP,和MMR是多样性最主流的方法),以找到满足 mashup 创建功能要求的各种 API 组合。具体来说,用于 mashup 创建的 API 推荐问题被建模为一个图搜索问题,在 API 的相关图中找到最小斯坦纳树 (MGST,minimal group Steiner trees,斯坦纳树问题是组合优化问题,与最小生成树相似,是最短网络的一种。最小生成树是在给定的点集和边中寻求最短网络使所有点连通。而最小斯坦纳树允许在给定点外增加额外的点,使生成的最短网络开销最小[2]),以推荐兼容的 API;并采用行列式点过程(DPP,determinantal point processes)来增加推荐结果的多样性。对常用的现实世界数据集进行实证评估,统计结果表明,DAWAR能够在推荐多样性、准确性和兼容性方面取得显著提升。
整体包括两个阶段,每阶段有两步,第一阶段是Assignment阶段,包括将开发人员请求建模为多代理系统 (MAGS)和查找 API 的候选组合两步;第二阶段是推荐阶段,包括构建DPP核矩阵和推荐最大化后验估计两步。两阶段对应的算法如下:
2.2 (Short Paper) Diversity vs Relevance: a practical multi-objective study in luxury fashion recommendations
论文链接:
https://dl.acm.org/doi/pdf/10.1145/3477495.3531866
论文机构: Farfetch
论文分类: (推荐)多样性、多目标
论文总结: 专注于准确性的个性化算法可能会提供高度相关的推荐,但推荐的项目可能与当前用户的偏好过于相似。因此,推荐系统可能会阻止用户探索新产品和新品牌(过滤气泡)。这对于奢侈品时尚推荐尤其重要,因为奢侈品购物者希望发现独家和稀有物品。因此,时尚推荐系统需要考虑多样性,并通过推荐目录中的新品牌和产品来提升购物体验。在这项工作中,我们探索了一些多样化策略来重新排列以相关性为重点的推荐系统的输出。随后,我们进行了同时优化相关性和多样性的多目标离线实验。我们使用覆盖率、偶然性和邻域距离等常用指标来衡量多样性,而为了相关性,我们选择了召回等排名指标。最佳的线下多元化策略将用户参与度提高了 2%,真实用户AB测试时,推荐的不同品牌的点击率提高了 46%。这些结果强调了在开发推荐系统时考虑准确性和多样性指标的重要性。
2.3 (Short Paper) Matching Search Result Diversity with User Diversity Acceptance in Web Search Sessions
论文链接:
https://dl.acm.org/doi/pdf/10.1145/3477495.3531880
论文机构: 俄克拉荷马大学、厦大
论文分类: (搜索)多样性
论文总结: 在保持排序结果相关性的同时提升排序的多样性对于增强以人为中心的搜索系统至关重要。虽然现有的排序算法和多样性信息检索指标为离线实验中评估和改进搜索结果的多样化提供了坚实的基础,但它忽略了用户多样性接受水平的潜在差异和时间变化。在这项工作中,用户多样性接受水平是指用户实际上更喜欢与主题多样化的搜索结果进行交互的程度。为了解决离线评估和用户期望之间的差距,我们提出了一种直观的多样性接受度度量,并基于来自受控实验室和自然环境的数据集进行了多样性接受度预测和多样性感知重排序的实验。我们的结果表明:1)不同查询段和会话上下文的用户多样性接受变化,并且可以从搜索交互信号中预测;2)我们的多样性感知重排序算法利用预测的多样性接受和估计的相关标签可以有效地最小化多样性接受和结果多样性之间的差距,同时保持搜索结果页面相关水平。我们的研究提出了在会话中平衡用户需求、结果多样性和搜索结果页面相关性的初步尝试,并强调了研究多样性接受对于促进有效结果多样化的重要性。
2.4 (Short Paper) Mitigating the Filter Bubble while Maintaining Relevance: Targeted Diversification with VAE-based Recommender Systems
论文链接:
https://dl.acm.org/doi/pdf/10.1145/3477495.3531890
代码链接: https://github.com/ZhaolinGao/TD-VAE-CF
论文机构: 多伦多大学、Optimy、迪肯大学
论文分类: 多样性
论文总结: 在线推荐系统很容易产生“过滤气泡现象 (filter bubbles)”,即只给用户推荐与其历史兴趣密切相关的内容。就媒体推荐而言,这可以通过在政治范围的极端推荐(例如,在经济上)来加强政治两极分化,即使该主题从多种政治观点中获得了广泛的覆盖,这些观点将提供更加平衡和更加平衡的知识用户的观点。之前最大边界相关性 (MMR) 已被用于使结果列表多样化,但存在三个主要缺点:(1) MMR 直接牺牲了多样性的相关性,(2) MMR 通常会在所有内容上多样化,而不仅仅是目标维度(例如,政治两极分化),(3)MMR 在实践中效率低下,因为需要计算推荐项目之间的成对相似性。为了同时解决这些限制,我们提出了一种新颖的方法,可以针对目标主题维度(例如政治极化)训练概念激活向量(CAV)。然后,我们在最先进的基于 VAE 的推荐系统中调制用户偏好的潜在嵌入,以沿目标维度多样化,同时在正交维度上保持主题相关性。我们的实验表明,与最大边际相关性 (MMR) 的非目标和目标变化相比,我们的基于目标多样化 VAE 的协同过滤 (TDVAE-CF) 方法在一系列多样化水平上更好地保留了内容与用户偏好的相关性;TD-VAE-CF 的计算效率也比 MMR 的事后重排序方法高得多。
3. 参考文献
[1] Mashup(网络应用混合)
[2] Minimal Steiner Tree