20篇最值得一读的深度推荐系统与CTR预估论文

作者 | 深度传送门

转载自深度传送门（ID: gh_5faae7b50fc5）

微博上近日流传一个段子，“2020年曾是各大科幻片中遥远的未来，但是现在离这个遥远的未来也只有6个月时间了”。只是借此感慨一下2019年转瞬之间半年的时间已经过去了，目前深度学习火热朝天，深度学习在推荐系统和CTR预估工业界的论文也是一篇接着一篇良莠不齐。

接下来主要总结一下2019年上半年工业界深度推荐系统与CTR预估上值得精读的论文。个人整理难免遗漏，也欢迎各位同行朋友评论另外哪些想额外推荐精读的论文。

1. Top-K Off-Policy Correction for a REINFORCE Recommender System, WSDM 2019, Google 作者：Minmin Chen, Alex Beutel, Paul Covington, Sagar Jain, Francois Belletti, Ed Chi；论文：t.cn/EUus1wu；Keynote：t.cn/EJFyMBk；

位列首位的当属Youtube推荐强化学习的两篇论文。虽然强化学习目前在推荐系统和CTR预估领域工业界由于系统复杂、效果未有显著提升等众所周知的原因确实不够成熟也尚未大规模应用起来。但是Youtube推荐的这两篇论文从某种程度上让强化学习的应用方向变得更明确了一些，而且作者在Industry Day上也宣称线上实验效果显示这个是YouTube单个项目近两年来最大的reward增长，也从某种程度上会激发各大公司的研究者们继续跟进的兴趣。

这是第一篇论文，提出了一种Top-K的Off-Policy修正方案将RL中Policy-Gradient类算法得以应用在动作空间数以百万计的Youtube在线推荐系统中。

2. Reinforcement Learning for Slate-based Recommender Systems: A Tractable Decomposition and Practical Methodology, IJCAI 2019, Google 作者：Eugene Ie, Vihan Jain, Jing Wang, ..., Jim McFadden, Tushar Chandra, Craig Boutilier；论文：t.cn/AiKFHvYU；

这是Youtube推荐应用强化学习的第二弹，主要贡献是提出了一种名为SLATEQ的Q-Learning算法，优化推荐系统里面同时展示给用户多个item情况的长期收益LTV（Long-term Value），将长期收益加入排序多目标中进行建模优化。重点在于与baseline使用的深度网络和输入特征都完全一样。详见：Youtube推荐已经上线RL了，强化学习在推荐广告工业界大规模应用还远吗？

3. Deep Learning Recommendation Model for Personalization and Recommendation Systems 作者：Maxim Naumov, Dheevatsa Mudigere, Hao-Jun Michael Shi,..., Bill Jia, Liang Xiong, Misha Smelyanskiy；论文：t.cn/Ai0rIUd0；代码：t.cn/AiNGzCsY；解读：t.cn/AiOX38PL；

FaceBook推荐最新论文，通过建模与系统协同设计提出一种butterfly-shuffle的机制来提升模型并行化，离线训练上在没有任何超参调优下收敛速度与准确率优于DCN，并开源了代码。

4. Feature Generation by Convolutional Neural Network for Click-Through Rate Prediction, WWW 2019, Huawei 作者：Bin Liu, Ruiming Tang, Yingzhi Chen, Jinkai Yu, Huifeng Guo, Yuzhou Zhang；论文：t.cn/AipAFS3p；

华为 at WWW 2019，提出基于卷积神经网络的CTR特征生成方法FGCNN，包含特征生成和深度分类器两部分，可以和任意CTR预估模型进行组合。

5. Deep Spatio-Temporal Neural Networks for Click-Through Rate Prediction, KDD 2019, Alibaba 作者：Wentao Ouyang, Xiuwu Zhang, Li Li, Heng Zou, Xin Xing, Zhaojie Liu, Yanlong Du；论文：t.cn/Ai0jTY68；代码：t.cn/Ai0jTY6u；

阿里 at KDD 2019，提出DSTN模型用于点击率CTR预估，考虑更多空域与时域的辅助信息包括上下文展示过的ad以及历史点击/未点击ad来更好地预测目标item的点击率。从论文实验数据看，效果大幅度超过DeepFM和GRU，并开源了代码。

6. AutoInt: Automatic Feature Interaction Learning via Self-Attentive Neural Networks 作者：Weiping Song, Chence Shi, Zhiping Xiao, Zhijian Duan, Yewen Xu, Ming Zhang, Jian Tang；论文：t.cn/AipG8aXz；代码：t.cn/EI8Pnso；

最新的深度CTR预估模型AutoInt，通过过Multi-head注意力机制将特征投射到多个子空间中，并在不同的子空间中捕获不同的特征组合形式，效果超过xDeepFM等达到最好。

7. Real-time Attention Based Look-alike Model for Recommender System, KDD 2019, Tencent 作者：Yudan Liu, Kaikai Ge, Xu Zhang, Leyu Lin 论文：t.cn/AiOaAg1Q；解读：t.cn/AiOaAg1E；

腾讯 at KDD2019，微信看一看团队对传统Look-alike进行了改造，提出实时Look-alike算法RALM，解决推荐系统多样性问题，效果好于YoutubeDNN。

8. Joint Optimization of Tree-based Index and Deep Model for Recommender Systems 作者：Han Zhu, Daqing Chang, Ziru Xu, Pengye Zhang, Xiang Li, Jie He, Han Li, Jian Xu, Kun Gai；论文：t.cn/AiN5T8Ks；TDM论文：t.cn/RQ5MrSg；

还记得阿里 at KDD 2018的深度树匹配召回模型TDM吗？升级版JTM提出索引与模型同时优化的方案，大幅提升召回效果。

9. A User-Centered Concept Mining System for Query and Document Understanding at Tencent, KDD 2019, Tencent 作者：Bang Liu, Weidong Guo, Di Niu, Chaoyue Wang, Shunnan Xu, Jinghong Lin, Kunfeng Lai, Yu Xu 论文：t.cn/Ai09Dxkd；解读：t.cn/Ai09DxkB；数据资源：t.cn/Ai09Dxkr；

腾讯 at KDD2019，构建了ConcepT概念挖掘标记系统，利用query搜索点击日志从用户视角提取不同的概念，以提高对短文本（query）和长文章（document）的理解，从而推动推荐，搜索等业务的提升。实验证明，ConcepT在 QQ 浏览器信息流业务中性能优异，曝光效率相对提升6.01%。

10. Deep Session Interest Network for Click-Through Rate Prediction, IJCAI 2019, Alibaba 作者：Yufei Feng, Fuyu Lv, Weichen Shen, Menghan Wang, Fei Sun, Yu Zhu, Keping Yang；论文：t.cn/AiN9QZnV；代码：t.cn/AiN9QZnV；

阿里 at IJCAI2019，考虑到不同用户行为序列的session内行为同构与session之间行为异构的特性提出了基于sesssion的CTR预估模型DSIN。使用self-attention机制抽取session内用户兴趣，使用Bi-LSTM针对用户跨session兴趣进行建模。

11. Interaction-aware Factorization Machines for Recommender Systems, AAAI2019, Tencent 作者：Fuxing Hong, Dongbo Huang, Ge Chen；论文：t.cn/Ai0WHak5；代码：t.cn/Ai0WHakt；

腾讯 at AAAI2019，提出IFM通过特征以及特征组不同角度灵活学习特征间交互的重要性，并提出了通用的Interation-NN框架和DeepIFM来捕捉高阶交互，效果优于DeepFM并开源了代码。

12. Multi-Interest Network with Dynamic Routing for Recommendation at Tmall 作者：Chao Li, Zhiyuan Liu, Mengmeng Wu, ..., Qiwei Chen, Wei Li, Dik Lun Lee 论文：t.cn/AiOao6I4；解读：t.cn/AiOao6I4；

阿里天猫提出MIND模型通过Dynamic Routing的方法从用户行为和用户属性信息中动态学习出多个表示用户兴趣的向量，更好的捕捉用户的多样兴趣，来提升召回的丰富度和准确度，效果好于YoutubeDNN。

13. Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction, KDD 2019, Alibaba 作者：Qi Pi, Weijie Bian, Guorui Zhou, Xiaoqiang Zhu, Kun Gai；论文：t.cn/AiN4s4oe；

阿里 at KDD2019，通过系统设计解决用户超长行为历史下CTR建模与在线预测性能瓶颈，效果好于GRU4Rec和DIEN。

14. Neural News Recommendation with Long- and Short-term User Representations, ACL 2019, Microsoft 作者：Mingxiao An，Fangzhao Wu，Chuhan Wu，Kun Zhang，Zheng Liu，Xing Xie；论文：t.cn/Ai029G81；

微软 at ACL 2019，LSTUR用于在新闻推荐任务中同时学习用户长期和短期的兴趣表示。模型的整体结构可分为新闻编码器、用户长期兴趣和短期兴趣模型、以及候选新闻的个性化分数预测模型，效果好于GRU4Rec。

15. Hierarchical Gating Networks for Sequential Recommendation, KDD 2019 作者：Chen Ma, Peng Kang, Xue Liu；论文：t.cn/AipuFYkG；代码：t.cn/AipuFYkb；

KDD2019，HGN提出通过feature与instance gating的多层级结构结合BPR来更好的捕获用户的长短期兴趣，效果好于GRU4Rec以及NextItRec。

16. Behavior Sequence Transformer for E-commerce Recommendation in Alibaba, KDD 2019, Alibaba 作者：Qiwei Chen, Huan Zhao, Wei Li, Pipei Huang, Wenwu Ou 论文：t.cn/Ai9JgWoJ；解读：t.cn/AiKBda4q

阿里巴巴搜索推荐事业部的新研究，首次使用强大的 Transformer 模型捕获用户行为序列的序列信号，供电子商务场景的推荐系统使用。原有DIN 提出使用注意力机制来捕获候选项与用户先前点击商品之间的相似性，但未考虑用户行为序列背后的序列性质。离线实验和在线 A/B 测试表明，BST 与现有方法相比有明显优势。目前 BST 已经部署在淘宝推荐的 rank 阶段，每天为数亿消费者提供推荐服务[2]。

17. Operation-aware Neural Networks for User Response Prediction 作者：Yi Yang, Baile Xu, Furao Shen, Jian Zhao；论文：t.cn/AiO2Dp5k；代码：t.cn/Ev4H3Jm；

深度CTR预估新积木：PNN FFM - FM = ONN模型，效果好于DeepFM和PNN。

18. BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer, Alibaba 作者：Fei Sun, Jun Liu, Jian Wu, Changhua Pei, Xiao Lin, Wenwu Ou, Peng Jiang；论文：t.cn/AiNqPitA；

Transformer引入推荐系统工业界，利用用户历史点击序列预测下一个点击item，效果超过GRU4Rec。

19. A Capsule Network for Recommendation and Explaining What You Like and Dislike, SIGIR2019, Alibaba 作者：henliang Li, Cong Quan, Li Peng, Yunwei Qi, Yuming Deng, Libing Wu；论文：t.cn/AiOLWp6x；

阿里 at SIGIR2019，胶囊神经网络应用于推荐提出CARP模型来从评论中更好地建模用户对商品的喜好程度，效果好于最新的ANR等。

20. Representation Learning-Assisted Click-Through Rate Prediction, IJCAI 2019, Alibaba 作者：Wentao Ouyang, Xiuwu Zhang, Shukui Ren, Chao Qi, Zhaojie Liu, Yanlong Du；论文：t.cn/Ai0jcGIZ；代码：t.cn/Ai0jcGIw；

阿里 at IJCAI2019，提出DeepMCP模型通过匹配、关联、预测三个子模块更好地建模用户-ad，ad之间以及特征-CTR关系，效果优于DeepFM并开源了代码。

（*本文为 AI科技大本营转载文章，转载请联系原作者）

推荐系统强化学习 jquery

0 人点赞