2018年度腾讯犀牛鸟精英人才培养计划优秀学生成果分享(二)

2019-10-18 09:40:18 浏览数 (1)

随着互联网的发展逐渐进入 “深水区”,基础研究与应用研究融通创新发展已引发业界广泛关注,协调产学各方资源,加速培养更多创新型研究人才变得尤为重要。腾讯自2017年开启“犀牛鸟精英人才培养计划”,借助其独特的数据资源和平台优势,联动高校共同培养新时期创新型研究人才,助力科技创新及应用成果落地。

目前2018年度精英人才培养计划已进入收尾阶段,并将在2019年10月18日CNCC大会期间完成奖学金评选,届时,14位优秀学生将对他们的学习成果进行公开答辩,竞选本年度一至三等奖学金个人风采奖勤奋好学奖

在为期一年的培养周期中,学生不仅在企业导师及学校导师联合指导下开展科研工作,基于海量数据及真实业务场景验证学术理论。同时,还通过“智学&智享”活动,与海内外学术大咖面对面交流;学习专属培训课程;与精英学生交流,拓展人脉圈子,助力自己全面提升。截止目前2018年度入选学生累计发表CCFA类及B类学术论文近30篇发明专利20余项,多个创新算法已在真实场景及数据中验证、转化。

小编将分两期为大家分享参与奖学金答辩的14位学生的研究课题及成果情况。本期将介绍另外7位学生的研究课题及成果情况。

回顾上篇,请点击 2018年度腾讯犀牛鸟精英人才培养计划优秀学生成果分享(一)。

中国科学院计算技术研究所  罗玲

课题名称:基于语义分析和知识推理的深度文本理解技术及其应用

课题简介:研究和探索基于语义分析和知识推理的深度文本理解技术以及其开放域聊天等场景的应用。

课题成果:

1. 论文发表:有关方面抽取的文章 Unsupervised Neural Aspect Extraction with Sememes 被IJCAI 2019 录用;有关抽取式摘要方法的文章Reading Like HER: Human Reading Inspired Extractive Summarization 被 EMNLP 2019 录用。

2. 技术应用:参与课题期间完成了简易对话标注系统,已投入使用。

清华大学  吴航昊

课题名称:阅读理解与问答

课题简介:众所周知,阅读理解与问答是NLP领域内一个非常基础而又有研究价值的课题,然而我的工作既没做阅读理解,也跟问答无关。科研有时就像一段说走就走的旅行,出发时,课题还叫阅读理解与问答,走着走着,就被做成文本到图像生成了。文本到图像的生成分为两步,首先要求模型学习两个模态各自的语义并以此为基础建立跨模态的对应关系,然后再根据模型理解的文本语义来生成图像。近年来,由于生成对抗网的进步,图像生成的质量得到了极大的提升,但生成图像与文本的语义对应还存在提高的空间。因此我们尝试引入自注意力机制以及使用对抗提取语义等方法来增强模型跨模态语义理解的能力。实验证明我们的方法取得了更好的效果。

课题成果:

1. 完成了“文本与图像匹配"与"文本到图像生成”任务的调研;

2. 在部门内进行关于“生成对抗网络"以及”跨模态文本与图像语义匹配"相关内容的学术分享;

3. 参与“基于自注意力机制的视觉语义嵌入模型(SAVE)”的实验设计与以及文章撰写;

4. 完成“基于对抗训练的视觉语义嵌入模型(AdViSE) ”的训练与文章撰写;

5. 撰写专利“一种基于多尺度自注意力机制的图文互检索方法”。

上海科技大学  刘闻

课题名称:Liquid Warping GAN: 一种适用于人体动作迁移、人体换衣和新视角生成的统一框架

课题简介:在腾讯实习期间,我继续探索在校期间研究关于人体动作迁移的问题,并和AI Lab的马林和罗文寒两位研究研究交流并提出了一套基于三维人体建模和生成对抗网络的方案。其中三维人体网格估计模块首先对输入的图片进行三维网格建模,然后对可见部分进行纹理提取。而通过生成对抗网络对不可见部分的纹理进行预测然后渲染出一个更加真实自然的图片。该方案不仅能处理人体动作迁移, 一旦训练完成,该模型也能适用于人体换衣和新视角生成这两个任务。该工作发表于ICCV 2019。

课题成果:

1. 会议接受论文:Liquid Warping GAN: A Unified Framework for Human Motion Imitation, Appearance Transfer and Novel View Synthesis,Wen Liu, Zhixin Piao, Jie Min, Wenhan Luo, Lin Ma, Shenghua Gao, ICCV 2019;

2. 专利:关于“基于三维人体网格重建与对抗生成网络的动作迁移方法”的专利技术交底书,离职前已经提交给马林老师并申请专利;

3. 社会影响:关于Liquid Warping GAN获得机器之心等科技媒体报道,2019年9月27日开源关于Liquid Warping GAN的代码,截至目前为止,在Github上已经或者超过800个star。"

东北大学  李倩

课题名称:大规模知识图谱的构建与在问答系统中的应用

课题简介:构建大规模的领域知识图谱,重点进行知识获取、知识表达、和基于知识的自动问答的研究。

课题成果:

1. 针对问题语句改写的专利(审查合格)和论文(被EMNLP Workshop MRQA录用);

2. 针对知识图谱嵌入的专利(交底书已提交)和论文(投递中);

3. 论文:Incremental Transformer with Deliberation Decoder for Document Grounded Conversations 被ACL2019录用(合作);

4. QuAC榜第五名(合作)。

北京大学  位冰镇

课题名称:非自回归机器翻译

课题简介:机器翻译技术在最近几年快速发展,取得了很大进步。这主要得益于深度神经网络在该领域的广泛应用。神经机器翻译在深度学习的加持下,取得了一系列里程碑式的成就。现有的主流机器翻译方法主要是基于自回归模型,这类模型的特点是在解码过程中以时序的方式生成目标语言。这一性质导致解码器无法并行,该问题在机器翻译任务中尤为严重,因为其词表往往很大,计算更为耗时。本课题探索了非自回归方法在机器翻译中的应用,是机器翻译领域新近提出的一个研究方向,旨在探索更高效的机器翻译的模型与方法,以兼顾质量和速度。本课题以此为目标,展开一系列研究工作。

课题成果:

本课题研究成果发表于ACL 2019会议,论文标题 Imitation Learning for Non-Autoregressive Neural Machine Translation。

中国人民大学  赵哲

课题名称:自然语言处理在腾讯信息安全中的应用

课题简介:如何表示文章和句子是目前自然语言处理(NLP)研究领域的一个热门话题。目前的主要方法是从大量的无标注语料中学习有用的特征以表示句子。很多研究者都尝试了无监督的句子表示方法,包括Google 的 Doc2Vec、Facebook 的 Sentence2vec等。然而其中有几个关键问题需要被解决:1. 怎样将词的语义嵌入到句子表示中;2. 如何有效的表示长文和中文文章;3. 怎样定义目标函数将无监督问题转化成自我监督问题进行学习。目前平台上累积了海量丰富的文章,长短不一领域各异。如何有效的训练文章表示模型并利用迁移学习将已经学习到的信息用在之后的 NLP任务上是这个项目的主要研究方向。

课题成果:

开发了BERT-PyTorch系统,获得了腾讯代码文化节银奖。所开发的BERT-PyTorch被广泛用于部门内部的项目之中,包括政治、低俗、辱骂分类等任务,为公司的多种产品的文本内容安全保驾护航。开发了UER-py系统(https://github.com/dbiir/UER-py)。UER-py是一个预训练模型框架,能支持编码器、目标任务等的任意的组合,使得用户能够快速实现和改进不同的预训练模型(例如BERT、GPT、ELMO)。此外我们基于UER-py构建了中文预训练模型仓库(model zoo),能够满足多种使用预训练模型的场景。基于这个模型仓库,我们在SMP隐式情感分析比赛中取得了银奖(3/109)。目前,UER-py在github上开源,得到了较为广泛的关注,并得到了EMNLP2019(system paper)的录用。

上海交通大学  唐宏阳

课题名称:基于域间自适应的动物姿态检测方法研究

课题简介:姿态估计是计算机视觉领域中非常重要的研究课题,目前大多数方法都聚焦在对人体姿态的预测,却忽略了同样具有重要作用且更加有挑战性的对于动物姿态的检测问题。准确地识别动物的姿态对于理解动物的行为、习性具有重要的作用,能够帮助我们更好地与动物相处,在保护一些珍稀动物方面也有着重大帮助。该课题拟探究动物姿态检测的普适性方法,我们希望可以实现跨物种的姿态检测,构建一个能够识别多种物种姿态,即使是在缺乏训练集的情况下依旧能够有效检测出动物姿态的通用性强的系统。

课题成果:

我们提出一种弱监督和半监督情况下域间自适应的算法(WS-CDA),能够有效提取到不同物种的姿态公共特征,并进一步通过渐进的自监督学习(PPLO)方法,实现了跨物种的动物姿态检测。相关论文被国际计算机视觉大会ICCV‘2019录用为口头报告(Cross-Domain Adaptation for Animal Pose Estimation Hongyang Tang, Jinkun Cao, Hao-Shu Fang and Xiaoyong Shen, Cewu Lu, Yu-Wing Tai)同时我们构建了一个具有多种动物姿态标注的数据集(animalPose-dataset),数据集现已经开源,旨在促进学术界对于动物姿态相关问题的研究。

0 人点赞