随着Internet的快速发展,当今信息科学的基本问题之一变得更加重要,即如何从通常庞大的信息库中识别满足用户需求的信息。目的是在正确的时间,地点和环境下仅向用户显示感兴趣和相关的信息。如今,两种类型的信息访问范例,即搜索和推荐,已广泛用于各种场景中。
在搜索中,首先会对文档(例如Web文档,Twitter帖子或电子商务产品)进行预处理并在搜索引擎中建立索引。此后,搜索引擎从用户那里进行查询(多个关键字)。该查询描述了用户的信息需求。从索引中检索相关文档,将其与查询匹配,并根据它们与查询的相关性对其进行排名。例如,如果用户对有关量子计算的新闻感兴趣,则查询“量子计算”将被提交给搜索引擎,并获得有关该主题的新闻报道。
与搜索不同,推荐系统通常不接受查询。取而代之的是,它分析用户的个人资料(例如,人口统计信息和环境)以及商品的历史互动,然后向用户推荐商品。用户特征和项目特征被预先索引并存储在系统中。根据用户对它们感兴趣的可能性对项目进行排名。例如,在新闻网站上,当用户浏览并单击新文章时,可能会显示几条具有相似主题的新闻文章或其他用户与当前文章一起单击的新闻文章。
表1.1总结了搜索和推荐之间的区别。搜索的基本机制是“拉”,因为用户首先发出特定的请求(即提交查询),然后接收信息。推荐的基本机制是“推送”,因为向用户提供了他们没有明确要求的信息(例如,提交查询)。这里的“受益人”是指在任务中要满足其利益的人。在搜索引擎中,通常仅根据用户需求创建结果,因此受益者是用户。在推荐引擎中,结果通常需要使用户和提供者都满意,因此受益者都是他们。但是,最近这种区别变得模糊了。例如,某些搜索引擎将搜索结果与付费广告混合在一起,这对用户和提供者都有利。至于“偶然性”,这意味着常规搜索更多地关注明显相关的信息。另一方面,常规建议可以提供意想不到但有用的信息。
表1.1:搜索和推荐的信息提供机制