基于用户行为分析的推荐算法是个性化推荐算法的重要算法。也就是协同过滤算法。
简单理解,就是通过不断分析用户以及和用户兴趣相同兴趣的人,跟网站互动,不断更新,找到用户最喜欢的物品,过滤掉不喜欢的物品。
用户行为数据:日志信息。
用户行为数据分为:显性反馈数据和隐性反馈数据。就用户行为来说,用户行为分为显性反馈行为和隐形反馈行为。
显性反馈主要是指用户做出明确选择,比如打分、点赞或者点不喜欢。
隐性反馈主要是指用户浏览、购买、阅读等隐形行为,记录在日志系统中,而没有做出具体的喜好意向等。
Power Law现象,在互联网领域也被称为长尾分布
一般认为新用户倾向于浏览热门的物品,而老用户会逐渐开始浏览冷门的商品。这个也是需要区分用户的,比如对电影,一个成熟的用户就会倾向观看小众电影。购物也是。但是对生活服务类,小众这个概念,就会弱化很多。
协同过滤算法:
1、基于邻域的方法:
1)基于用户的协同过滤算法:推荐和用户兴趣相似的其他用户的兴趣物品
* 找到和目标用户兴趣相同的用户集合;
* 找到这个集合中用户喜欢得,且目标用户没有听说过的推荐给目标用户;
2)基于物品的协同过滤算法:推荐用户感兴趣的物品相似的物品
* 并不利用物品的内容属性计算物品之间的相似度,而主要通过分析用户的行为记录计算物品之间的相似度。
* 可以利用用户的历史行为给推荐结果提供推荐解释。
2、隐语义模型:
3、基于图的随机游走算法: