相信大家这几天的朋友圈已经被网易云音乐的年度听歌报告给刷屏了吧!不知道你们2018的年度关键词是什么,我的关键词是“青春”。
不少人一提到听歌软件第一个想到的就是网易云音乐,肯定是有不少人被这款软件“折服”了的,不仅是因为每次它推荐的歌单几乎次次惊艳,更是因为那一首首动人的音乐下面那一个个更动人的故事… …
那么大家知道网易云音乐每日推荐的歌单是怎么挑选出来的吗?到底是算法还是官方团队与众多音乐达人合作推荐的呢?
首先,一个优秀的推荐系统不仅仅是个性化算法这么简单,基础的也好,神奇的也好,一个完整的推荐系统体系就要提及到官方团队推荐、UGC以及热门推荐的协作。
其实不管什么样的推荐算法几乎都是基于一个词——相似度。都需要用户的行为数据,以及歌曲的元数据,比如旋律,Tag等等。实现起来也不算难。在此就不详细介绍。
其实大多数用户一开始听歌肯定会从自己熟悉的歌曲开始,然后一般都会给出非常相关的推荐,比如你听周杰伦的任何歌,那他的其他任何热门歌曲都会成为非常相关。但如果全都给你推荐同一个人的歌曲,那未免有些单调。
这个时候就要考虑来做一个多样化过滤了,以限制来自同一个歌手的推荐数量,这样后面更多歌手的就会被推上来。
那现在问题又出来了,假如一个热门歌手,就拿陈奕迅举例。突然出了新专辑,用户们一下子都跑去听新的了,包括周杰伦的粉丝可能也会去凑一下热闹。
那这下用户们看到的推荐里肯定都能看到陈奕迅的歌了,尽管他的歌曲可能和周杰伦的不那么相关。
为了解决这个问题,就要在计算相似度的时候把一些过于热门的歌曲给过滤掉,把这些歌曲推后会在一定程度上解决问题。
那说完热门的了,再说说冷门的情况。其实有时候你会发现,某个不知名歌手也会很符合你的胃口,那怎样才能把他的歌曲送到你的推荐里呢?这个时候就可以用归一化(Normalization)技巧进行微调。在此也不做详述。
话说回来,据官方声称推荐算法设定了基于不同用户行为的权重,下载量,收藏,搜索,分享,甚至是点击“不感兴趣”,这些行为都是可以作为推荐参考的。
而除了算法推荐外,人工过滤的作用也是必不可少的,从产品及运营角度确立人工规则,从而筛出不符合条件的选项。有些时候,人工更是能补偿算法的不足。因此除了算法团队,网易云音乐也有编辑团队。
他们会在一开始的推荐内容上做一层筛选,找出那些比较优质的内容,其次也会解决算法的一些收敛问题,因为如果纯依靠算法推荐会对一些新内容响应较慢。
最后总结一下就是,协同过滤是基础,但基于内容的复杂算法让网易云音乐更加与众不同,同时人工介入也很重要,一是反馈,二是运营。
相信大家看到这里,对这款软件又有了更进一步的了解了吧?