以推荐系统为例,视频 embedding 分为基于内容的 embedding 和基于行为的 embedding
- 基于内容的embedding。nlp或cv技术使用视频的标题、封面、图像,音频等视频自身属性信息获取特征。
- 基于行为的embedding。基于用户与视频的交互行为数据获得,比如我们发现用户在一个 session 中,前后点击的视频存在一定的相似性,通常会表现出对某类型视频的兴趣偏好,可能是同个风格类别,或者是相似的话题人物等。因此我们将一段时间内用户点击的视频 id 序列作为训练数据,使用 skip-gram 模型学习视频的 embedding 特征。 但是对新视频无法获得embedding,可以使用视频的一、二级类目、视频标签、视频时长、清晰度、距离发布的时间等视频属性信息。如取平均embedding作为相同属性的视频的embedding。