总第529篇
2022年 第046篇
今年,美团技术团队有多篇论文被KDD 2022收录,这些论文涵盖了图谱预训练、选择算法、意图自动发现、效果建模、策略学习、概率预测、奖励框架等多个技术领域。本文精选了7篇论文做简要介绍(附下载链接,论文排名不分先后),希望能对从事相关研究方向的同学有所帮助或启发。
论文01:Mask and Reason: Pre-Training Knowledge Graph Transformers for Complex Logical Queries(支持知识推理的图谱预训练)
论文02:AutoFAS: Automatic Feature and Architecture Selection for Pre-Ranking System(粗排场景自动特征与结构选择算法)
论文03:Automatically Discovering User Consumption Intents in Meituan(用户消费意图自动发现)
论文04:Modeling the Effect of Persuasion Factor on User Decision for Recommendation(说服因素效果建模)
论文05:Practical Counterfactual Policy Learning for Top-K Recommendations(用于 Top-K 推荐的反事实策略学习)
论文06:Applying Deep Learning Based Probabilistic Forecasting to Food Preparation Time for On-Demand Delivery Service(深度学习订单出餐时间概率预测)
论文07:A Framework for Multi-stage Bonus Allocation in Meal Delivery Platform(多阶段送餐奖励框架)
ACM SIGKDD国际会议(简称 KDD)是由ACM的数据挖掘及知识发现专委会主办的数据挖掘研究领域的顶级年会,属于CCF A类会议。由于KDD的交叉学科性和广泛应用性,其影响力也越来越大,吸引了来自统计、机器学习、数据库、万维网、生物信息学、多媒体、自然语言处理、人机交互、社会网络计算、高性能计算及大数据挖掘等众多领域的从业者和研究学者。第28届KDD会议于2022于8月14日至18日在美国华盛顿举行。
论文01:Mask and Reason: Pre-Training Knowledge Graph Transformers for Complex Logical Queries(支持知识推理的图谱预训练)
| 下载地址:KG-Transformer
| 论文作者:刘潇(清华大学)、赵时予(清华大学)、苏凯(清华大学)、岑宇阔(美团)、裘捷中(清华大学)、东昱晓(清华大学)、张梦迪(美团)、武威(美团)、唐杰(清华大学)
| 论文简介:面向复杂逻辑查询的知识图谱预训练。论文研究了知识图谱中复杂逻辑查询问题,讨论了主流的基于知识图谱嵌入的推理器的固有缺陷,并提出了基于KGTransformer的新型图神经网络推理器,及其对应的预训练与微调方法。KGTransformer在两个主要的知识图谱推理数据集上取得了最优的结果,尤其是在域外任务上取得了良好的泛化性能,证明了这一思路应用于知识图谱推理的广泛前景。
论文02:AutoFAS: Automatic Feature and Architecture Selection for Pre-Ranking System(粗排场景自动特征与结构选择算法)
| 下载地址:AutoFAS
| 论文作者:李想(美团)、周晓江(美团)、肖垚(美团)、黄培浩(美团)、陈达遥(美团)、陈胜(美团)、仙云森(美团)
| 论文简介:工业级别的搜索推荐系统主要遵循召回、粗排、精排、重排的算法体系。为了满足粗排巨大的打分规模和严格的时延要求,双塔模型仍然被广泛使用。为了提高模型的效果,一些方案会额外使用精排的打分知识进行蒸馏。但仍有两大挑战亟待解决:
- 如果不把时延真正作为一个变量放到模型中进行联合优化,效果必然大打折扣;
- 如果把精排的打分知识蒸馏给一个手工设计的粗排结构,模型的表现也肯定不是最优。
本文使用了神经网络框架搜索 (Neural Architecture Search) 的方法,开创性地提出了AutoFAS (Automatic Feature and Architecture Selection for Pre-Ranking System) 的算法框架,统一解决了以上两个问题:在给定时延限制和精排打分知识指导的条件下,同时选出最优的粗排特征与结构组合方案,达到了SOTA的效果。本方案已经在美团主搜场景下全量使用,取得了明显的线上提升。
论文03:Automatically Discovering User Consumption Intents in Meituan(用户消费意图自动发现)
| 下载地址:Automatically Discovering User Consumption Intents
| 论文作者:李银峰(清华大学)、高宸(清华大学)、杜小毅(美团)、韦华周(美团)、罗恒亮(美团)、金德鹏(清华大学)、李勇(清华大学)
| 论文简介:城市中用户的消费行为往往由特定意图驱动。消费意图作为用户具体消费行为的决策驱动力,对于提升城市中用户行为建模的可解释性和准确性至关重要,能够广泛应用于推荐系统和精准化营销等多种业务场景。然而,消费意图难以获取,从用户消费数据和评论中只能挖掘到十分有限的意图类型。因此,从消费数据中自动地发现新的未知意图是一项至关重要但极具挑战性的任务,主要面临以下两点关键性挑战:(1)如何对不同类型偏好下的消费意图进行编码;(2)如何仅用少量的已知意图实现对未知意图的发现。为了应对上述挑战,本文提出了基于超图神经网络和半监督学习的意图发现模型AutoIntent(包括解纠缠的意图编码器和意图发现解码器两部分),实现对美团用户消费意图的自动发现。
具体而言,在解纠缠意图编码器中,本文构建了三组对偶超图来分别捕获三种不同类型偏好(时间相关偏好、地点相关偏好和内在偏好)下的高阶关系,并通过超图上的信息传播机制为用户学习解纠缠的意图表征。在意图发现解码器中,本文基于去噪后的意图表征相似性来构建成对样本的意图伪标签,通过半监督学习的方式实现从已知意图到未知意图的知识迁移,完成意图发现。本文在美团大规模的工业数据集上与多种先进基准算法进行比较,实验结果表明,提出的AutoIntent方法相比于已有最佳方案可以取得15%以上的显著性能提升。总的来说,本文为理解并建模城市中的用户消费行为提供了一种新的研究思路。
论文04:Modeling Persuasion Factor of User Decision for Recommendation(说服因素效果建模)
| 下载地址:Modeling Persuasion Factor
| 论文作者:刘畅(清华大学)、苑苑(清华大学)、高宸(清华大学)、白琛(美团)、罗灵锐(美团)、杜小毅(美团)、史鑫磊(美团)、罗恒亮(美团)、金德鹏(清华大学)、李勇(清华大学)
| 论文简介:在真实城市生活中,对于餐饮、出行等实际需求,用户会综合根据品牌、价格等多个方面的因素做出决策。现有的推荐系统对这些因素建模往往呈现“黑盒”形式,未能回答具体决策因子如何影响用户决策行为的科学问题,从而导致推荐性能受限。本文基于真实世界的餐饮消费、出行数据,利用用户交互行为数据与对应不同因素的说服文案数据,显式建模各类因素对用户决策的影响,提升推荐系统准确率与可解释性。
具体而言,首先构建用户-商品交互图,将不同类别的说服文案作为图中的异质边,利用多层图卷积网络生成用户、商品与文案的表征;其次,考虑到不同用户对说服文案的敏感程度不同,在交互概率预测过程中个性化地为每个用户的敏感性进行自适应建模,提高预测置信度。进一步地,为解决普遍存在的用户交互记录稀疏性的问题,提出基于反事实推断的数据增强方式,合理生成了大量高质量数据,有效辅助了表征学习的过程,实现精准推荐。本文在美团大规模业务数据集上与多种先进基准算法比较,取得了显著的性能提升;进一步的分析表明,提出的模型能够有效表达用户对不同因素的偏好,同时准确建模了不同用户之间的行为差异。总的来说,本文为研究城市中用户决策行为的可解释机理提供了基础。
论文05:Practical Counterfactual Policy Learning for Top-K Recommendations(用于 Top-K 推荐的反事实策略学习)
| 下载地址:Counterfactual_Top-K/xcf
| 论文作者:刘亚旭(台湾大学&美团实习生)、颜瑞楠(台湾大学)、原博文(台湾大学&美团实习生)、史润东(美团)、燕鹏(美团)、林智仁(台湾大学)
| 论文简介:对于训练机器学习模型,一项关键任务是通过收集的反馈(例如,评分、点击)来构建训练数据。然而,从理论和实际经验中可以发现,收集的反馈中选择偏差会导致训练得到的模型有偏,从而导致训练结果是不是最优策略。为了解决这个问题,反事实学习受到了很多关注,现有的反事实学习方法可以分为Value Learning 方法和Policy Learning方法。
本文研究了具有较大决策空间的Top-