语言:python3.5
库:Surprise
平台:jupyter notebook
描述:此推荐系统类似网易云音乐推荐歌单以及推荐相似歌曲。
AI项目体验地址 https://loveai.tech
1. 数据获取
使用爬虫爬取了网易云音乐中80w首歌400w 次收藏的歌单,存储格式为json格式,数据大小为3.59G,格式说明如下:
2. 数据解析
2.1 原始数据=>歌单数据
抽取 歌单名称,歌单id,收藏数,所属分类 4个歌单维度的信息 抽取 歌曲id,歌曲名,歌手,歌曲热度 等4个维度信息歌曲的信息
组织成如下格式:
代码语言:javascript复制
2.2 歌单数据=>推荐系统格式数据
主流的python推荐系统框架,支持的最基本数据格式为movielens dataset,其评分数据格式为 user item rating timestamp,把数据处理成这个格式。
2.3 保存歌单和歌曲信息备用
保存 歌单id=>歌单名 和 歌曲id=>歌曲名 的信息
3.使用python推荐系统库Surprise完成项目
3.1用协同过滤构建模型并进行预测
3.1.1 推荐歌单
3.1.2 推荐歌曲
当然也可以使用其他的算法来实现,如:
4. 不同的推荐系统算法评估
可以使用不同的评估准则,如: