自然语言处理(Natural Language Processing,NLP)是人工智能的一个重要分支,它研究能实现人与机器之间用自然语言进行有效通信的各种理论和方法,即让机器“懂”人类的语言。NLP 涉及的面非常广,包括语音识别 、内容理解、信息检索、信息抽取、问答系统、机器翻译、对话系统等。其中短视频的应用场景下,内容标签技术是内容理解的一个重要手段。本文主要给大家介绍多模态短视频内容标签技术及在爱奇艺的相关应用。
全文共分为五个部分重点解读:
一、什么是内容标签
二、提取内容标签的方法
三、多模态短视频内容标签的难点
四、模型的迭代之路
五、内容标签的主要应用场景
一、什么是内容标签:
提到标签,推荐系统里面使用比较广泛的是内容标签和类型标签,其中内容标签是对文本、图文或者短视频等内容的表征(表征,就是用一些关键词或者是短语来表达对应的内容是什么含义)。内容标签是根据内容来生成的标签,也就是说有什么样的内容它就会有什么样的标签,标签的集合是开放的。然而类型标签是一个分类体系,就是把不同的内容分到不同的体系下面,这个分类体系是预先定义好的,这就是内容标签和类型标签两者的区别。
本质上内容标签和另一个我们经常使用的关键词抽取技术非常类似。但不同的是我们做内容标签的一个重要出发点是为了推荐系统来对各种内容生成标签。它更突出了推荐的应用场景,虽然内容标签的应用也不仅限于在推荐场景下,可以针对任何基于内容理解的场景内容,因为内容是一个广泛的含义,包括文本、图文、短视频等等。而关键词抽取,主要针对的是文本,它是从文本里面把跟该文本意义最相关的一些词语抽取出来,在文献检索、自动文摘、文本聚类/分类等方面有着重要的应用。
内容标签有什么作用?举三个典型的应用场景,让大家对内容标签有一个比较直观的印象:
第一,个性化推荐,通过对内容进行标签提取,结合用户的兴趣TAG,对用户进行精准的个性化推荐,是内容标签在个性化推荐上面的一个典型的应用。
第二,搜索,通过内容的关键词或者内容标签,跟用户输入的