最小推荐系统:协同过滤(Collaborative Filtering)

2020-06-23 10:29:44 浏览数 (1)

当UGC/PUGC社区发展到一定规模,需要从人工推荐(热门榜单、编辑推荐等策略)转向算法推荐信息流展示给用户。在这个阶段,我们会遇到推荐系统的冷启动问题,表现在两个方面:

1)一般意义的冷启动:新用户(或者新条目)到来的时候,没有用户行为记录,因而算法无法预测其兴趣爱好;

2)之前的人工推荐信息流导致社区信息的生产端(Item,条目)和消费端(User,用户)的分布都过于头部化,生产端的头部条目用户几乎都消费过,而腰部条目用户几乎都没有消费过。这种情况下关于条目和用户的描述都过于稀疏化。我们希望推荐系统在推荐给用户喜欢的条目的同时,能有效地扭转这种不健康的分布。在处理2)的过程中,我们需要频繁的调整各种参数,也就希望推荐系统有很高的可解释性。这种情况下,最为传统的推荐算法——协同过滤 的优势就显示出来了。

协同过滤算法基于一个基础的强预设:在观测到用户消费过条目A之后,我们有很高的可能性观测到用户会喜欢与A相似的条目B(Item CF)以及 相似的用户可能喜欢同一个条目。所以协同过滤的核心在于描述条目和用户的相似性。

在当今的技术环境下,协同过滤只适合用于最基础的解决方案,或者Hybrid System中的一个权重不高的条目。所以已经没有必要在系统迭代中把相似性描述设计的太

0 人点赞