2021腾讯犀牛鸟精英科研人才培养计划课题(九)——信息检索与推荐系统

2020-12-31 10:10:06 浏览数 (1)

12月11日,2021年腾讯犀牛鸟精英科研人才培养计划正式对外发布。计划截止申报时间为2021年1月28日24:00

本年度精英科研人才计划将延续人工智能领域顶尖科研人才培养,发布包含机器人、AI医疗、量子计算、智慧城市12个前沿热议方向71项研究课题。入选学生将由校企导师联合制定专属培养计划,并获得3个月以上到访腾讯开展科研访问的机会,基于真实产业问题及海量数据,验证学术理论、加速成果应用转化、开阔研究视野。同时项目组将为学生搭建线上和线下学习、交流平台,帮助学生挖掘更多潜能。

本期小编整理了该计划中“方向9:信息检索与推荐系统”,欢迎感兴趣的学生关注。

更多课题及方向介绍陆续推出,敬请关注。

(点击了解犀牛鸟精英科研人才培养计划申请指南

方向9

信息检索与推荐系统

课题9.1:多模态深度哈希算法研究(地点:深圳)

基于广告的多模态信息(图片、视频、文本),研究一种高效、准确的深度哈希编码方式。该哈希编码值之间的汉明距离能够有效的衡量广告视觉上的差异,从而用于快速计算广告间的相似度量,提升用户体验、提高营收、 简化运营分析。建议研究方向:1、基于两阶段的深度哈希算法研究:即在单模态的特征表达基础上(如单模态Embedding,或者单模态深度Hash),合理设计网络进行模态间的集成,实现多模态的哈希编码;2、基于端到端的多模态哈希算法研究:即在广告多模态数据的基础上,合理设计网络结构,直接计算哈希编码值。

导师简介:

腾讯专家研究员,新加坡国立大学计算机系博士。主要研究方向为多模态相似检索、大规模图像/视频/文本检索、物体检测/识别/分割/跟踪等。在ICCV、Pattern Recognition等顶级期刊会议发表论文14篇,并多次荣获OCR领域顶级ICDAR比赛冠军,担任CVPR、ICCV、ECCV、AAAI、IJCAI等会议Reviewer,ICDAR2019 PC Member。

课题9.2:用户行业广告深度转化意向挖掘(地点:深圳)

行业化精细建模与运营是广告业务未来重要增长点。本课题研究基于广告和画像数据进行用户行业广告深度转化意向挖掘。涉及包括深度学习、数据挖掘、图算法等。重点突破适用多层级目标,基于图算法的特征挖掘和不均衡数据场景的鲁棒易优化深度学习模型。

导师简介 :

腾讯专家研究员,伦敦大学学院(University College London)博士。研究领域为数据挖掘。目前发表了包括IEEE Transactions on Neural Networks and Learning Systems在内知名期刊发表6篇SCI论文。目前工作是用户行业广告意向挖掘与应用、用户线下兴趣特征挖掘与应用、兴趣点(POI)知识图谱挖掘与应用。

课题9.3:高性能的图关系特征学习算法(地点:深圳)

在社交网络中,针对用户关系学习到节点良好的关系表达对下游的分类、聚类、连接预测等下游任务至关重要。在海量数据场景,能否构建高效的节点关系特征表达算法与工业落地息息相关,同时也是一个巨大的挑战。研究内容:1、参与研究基于图的关系网络节点的半监督/无监督特征学习算法研究;2、开发分布式和单机CPU环境下高性能的图关系特征表达算法;3、参与图计算oTeam图相关算法组建的开源协同项目中。工作涉及但不限于:大规模数据的清理与筛选、分布式训练框架的搭建、节点特征表达的下游任务评估体系设计等。

导师简介:

腾讯专家研究员,毕业于西北农林科技大学,研究方向为大规模基因组数据挖掘。曾参与多个华大基因核心研发项目,主要成果发表于GigaScience。主导建立过出行行业领先的高准召、可解释的驾驶风险评估系统,广泛应用于出行业务的驾驶风险管理,部分研发成果发表至Accident Analysis and Prevention。

课题9.4:推荐系统的多目标学习研究(地点:深圳)

推荐业务中,为了更好的兼顾用户体验与内容生产者的收益,往往需优化多个不同方向的业务指标。我们认为多目标学习方法在实际应用中仍存在以下难题:1、网络结构的设计问题:需要平衡各目标之间的学习稳定性、子模型表达能力;2、样本中存在的标签不均衡及偏差(Bias)问题:实际业务中不同目标的样本标签不均衡且受到不同Bias的影响,在多目标学习场景下需要有效解耦;3、考虑任务难易程度的自监督学习:不同目标之间天然存在学习难易程度的差异,需要从自监督学习的角度,在不借助额外标签数据的条件下设计更加合理的学习范式。

导师简介:

导师1:腾讯专家研究员,毕业于华南理工大学数学系。毕业后入职腾讯,一 直从事数据挖掘相关工作。目前主要负责Network Embedding、社交画像建设等项目。

导师2:腾讯研究员,本科和博士均毕业于清华大学电子工程系,目前研究方向为推荐系统中的隐式反馈学习和多目标学习,曾在NeurIPS、IJCAI、WWW、TKDE、TOIS、CIKM、SDM等前沿会议/期刊发表超过10篇学术成果。

课题9.5:基于社交场景中内容传播的推荐研究(地点:北京)

在微信场景中,内容的传播与用户社交网络关系密切。现有的推荐系统通常较少考虑依赖社交中内容传播的推荐。我们希望能够通过图神经网络等模型,融合用户兴趣偏好和内容多模态特征,充分结合强弱社交关系,对用户、内容以及各种用户行为进行合理建模,从而提升在线推荐效果。

课题9.6:复杂推荐场景下异构内容多模态研究(地点:北京)

微信的推荐场景中拥有各种富媒体形式的推荐源。因此,各类复杂的异构/多元/内外部场景的内容深度和细粒度刻画就显得尤为重要。多模态表示学习是综合各种模态数据的重要方法之一。模态信息对齐、知识融合、模态消歧、结合社交以及用户维度信息融入的内容模态刻画等,都是当前研究的热点或欠缺深入的点。通过多模态技术的深入研究,将多种模态信息综合表达,能够更好地对数据做理解和挖掘,服务建模过程的特征表示。

9.5-9.6导师简介:

导师1:腾讯高级研究员,浙江大学毕业,主要研究方向包括:广告系统、自然语言处理、知识图谱、推荐技术、数据挖掘。拥有多项相关技术专利,在ACL、AAAI、NIPS等顶会上发表过多篇文章。

导师2:腾讯专家研究员,中国科学院计算技术研究所毕业,当前负责微信推荐的技术研发和产品应用,在ACL、EMNLP、KDD、SIGIR、AAAI、IJCAI等顶会上发表过多篇文章,拥有相关领域多项专利。

课题9.7:迁移场景下的内容推送优化研究(地点:北京)

微信中存在不同的推荐场景。我们希望能够综合利用不同场景和不同业务的数据,在新场景的内容推送中进行领域迁移学习,实现技术积累并辅助新场景推送内容的优化。同时,我们希望研究推荐推送问题,根据用户的行为反馈,优化用户推送的时间点和每天的推送数量,唤醒用户对于产品的粘性,提升产品指标。

导师简介:

腾讯专家研究员,中国科学院计算技术研究所毕业,拥有多项相关技术专利,在ACL、AAAI、IJCAI等顶会上发表过多篇文章。

课题9.8:基于社交圈层划分的推荐系统研究(地点:北京)

微信生态下丰富的社交关系和行为能够为微信推荐提供重要的信息。在基于用户兴趣维度外,用户的社交属性和圈层属性蕴含着用户其它维度上的隐藏偏好。本项目希望在微信推荐的社交推荐场景中,充分利用微信社交网络信息以及文章在生态内的分享、点击、传播等行为信息,划分用户所属各种维度的圈层,探索高效合理的新技术,完成技术积累并提升推荐效果。

导师简介:

导师1:腾讯专家研究员,中国科学院计算技术研究所毕业,当前负责微信推荐的技术研发和产品应用,在ACL、EMNLP、KDD、SIGIR、AAAI、IJCAI等顶会上发表过多篇文章,拥有相关领域多项专利。

导师2:腾讯高级研究员,主要研究方向包括:推荐系统、用户画像、数据挖掘等。拥有多项相关技术专利,在KDD、CIKM等顶会上发表过多篇文章。

课题9.9:用户点击行为在搜索中的深入探索(地点:北京)

点击行为在搜索中是很重要的数据,很大程度上反应出用户的真实需求,然而点击也有很多挑战。比如位置偏置问题、更吸引眼球内容导致点击偏离主需求、长尾点击泛化等一系列问题,建模好点击行为是非常有挑战性的工作。我们希望在微信搜一搜场景,结合用户人群,把点击行为的建模做更多的探索。

导师简介:

腾讯专家研究员,西安电子科技大学毕业,主要研究方向为信息检索、自然语言处理、机器学习等,当前负责微信搜索的技术研发和产品应用,拥有多项相关技术专利,并在ACL、AAAI等顶会上发表过多篇文章。

课题9.10:多模态视频检索任务(地点:广州/深圳)

搜索场景是要找到Query和Item的匹配关系,利用文本、视频、图像、点赞等行为数据的多模态数据联合建模来满足用户的需求,所以大规模深度学习平台在海量数据(亿级)的建模预测是核心能力。同时所建模型会使用模态间的知识图谱/实体/标签等外部信息来辅助搜索排序。目标:在已有的排序相关性,时效性,权威性上面加上多模态的信息,提升用户的满意度。

导师简介:

腾讯专家研究员,毕业于美国斯蒂文斯理工(机器学习方向),并在UPENN从事1年智能推荐的博士后工作。发表20篇以上学术论文,曾指导团队发表多篇AI领域的顶会论文。

课题9.11:正样本稀疏条件下的Embedding方法研究(地点:深圳)

推荐系统中, Embedding 方法着重要作用。为了训练Embedding 模型, 工业界的算法工程师们用大量负样本和正样本构成的样本进行训练。在营销活动中,购买行为对应的正样本通常非常稀疏。本课题关注,正样本稀疏条件下,Embedding方法的探索。

导师简介:

腾讯高级研究员, 博士毕业于北京大学信息科学技术学院计算语言学研究所,拥有丰富技术研发经历。主要研究领域包括机器学习、自然语言处理、推荐系统和游戏 AI Bot 等。参与和负责多个国家课题项目,发表多篇学术论文和拥有多项技术发明专利。

课题9.12:强化学习在自动扩量策略的应用(地点:上海)

在广告计算系统的召回扩量场景中,需要通过算法对广告主成本达成与召回量之间进行平衡,因此算法在召回调节中具有非常重要的研究意义。本课题主要基于不同算法策略计算用户与广告的相关性,通过实时强化学习,以广告主的成本达成度以及系统广告多样性等作为Reward,采用不同的Action不断调节召回量,以快速优化在线召回效果,提升广告系统的整体最大收益。

导师简介:

腾讯高级研究员,负责过合约广告系统研发工作,目前负责召回策略研发工作,其研究领域包括深度学习、强化学习等,有KDD等顶会论文若干。

课题9.13:大规模推荐系统召回策略研究(地点:上海)

在大规模推荐系统召回场景中,面对海量的候选集合,推荐算法需要在推荐效果和计算效率之间进行有效的平衡。本课题旨在通过结合多层索引(例如,基于树结构的深度神经网络)或基于图神经网络的向量检索模型等前沿技术,弥补传统向量近邻检索模型的局限性,并在保障计算效率的前提下,使模型考虑更多的用户-商品交互特征,全面优化大规模在线推荐系统中的召回策略。

导师简介:

腾讯专家研究员,目前负责商品广告触发和推荐方向的研发工作,其研究领域包括自然语言理解、大规模在线推荐系统设计以及知识图谱等。

课题9.14:广告视频挖掘和推荐算法研究(地点:深圳)

本课题拟以广告视频和用户画像等大型多模态数据集为来源,针对广告视频中的多模态数据进行分析,提取隐含的知识结构,并融合系统历史数据对用户行为建立画像,从而基于多模态学习方式建立个性化的广告视频推荐,提升视频广告的点击率和转化率。本课题拟研究:1、构建面向视频的多模态数据并提取其中的隐含知识结构,在语义层面更好的理解视频内容;2、通过多模态信息的融合增强模型的预测能力与鲁棒性;3、开发推荐过程中对广告视频和用户画像两方面复杂的多模态信息语义匹配算法。

导师简介:

腾讯专家研究员,新加坡国立大学博士,杜克大学博士后,负责多创意广告线上择优的相关工作。曾担任机器学习Top Tier会议AAAI和IJCAI的Program Committee Member。共发表学术论文30 篇,总引用次数1800 。

项目申报方式

— 科研人才培养计划 —

手机扫码进入“预申报”,可获得更多项目通知

PC端访问网址,进入“申报”

https://www.withzz.com/project/detail/99

2021年度犀牛鸟精英人才培养计划

本年度犀牛鸟精英人才培养计划包括“犀牛鸟精英科研人才培养计划”和“犀牛鸟精英工程人才培养计划”两部分。其中科研人才计划旨在为致力于前沿科学研究的学生提供更优质的创新科研平台,助力其借助产业真实场景及海量数据,将理论研究和实践结合,验证学术理论,发表论文和专利。工程人才计划旨在以产业真实项目为牵引,在校企双导师指导下,模拟产业研发场景,组建学生研发团队,通过持续深入的挑战进阶式课题目标达成,培养学生系统性思维,拓展前沿技术视野,提升团队协作水平、解决复杂问题等核心创新能力。


2021腾讯犀牛鸟精英科研人才培养计划课题了解:

课题(一&二)——机器人相关技术研究&AI医疗

课题(三&四)——自动驾驶&量子计算

课题(五)——机器学习及其相关应用研究

课题(六)——语音技术

课题(七)——自然语言处理

课题(八)——视觉及多媒体计算

了解犀牛鸟精英计划更多详情:

2021腾讯“犀牛鸟精英人才培养计划”申请启动

2021腾讯“犀牛鸟精英科研人才培养计划”申报指南

2021腾讯“犀牛鸟精英科研人才培养计划”FAQ

2021腾讯“犀牛鸟精英工程人才培养计划”申报指南

2021腾讯“犀牛鸟精英科研人才培养计划”FAQ

点击“阅读原文”,进入预申报

0 人点赞