2020年CCF-腾讯犀牛鸟基金课题介绍(三)——知识图谱与自然语言处理&语音信号处理与语音合成&密码学

2020-06-10 11:10:04 浏览数 (1)

腾讯公司和中国计算机学会于2013年共同发起的CCF-腾讯犀牛鸟基金(以下简称犀牛鸟基金),始终致力于支持海内外青年学者开展前沿学术研究与技术实践。犀牛鸟基金通过提供企业真实问题与业务实际需求,搭建产学研合作及学术交流的平台,推动合作双方学术影响力的提升及研究成果的应用落地,促进自主技术的创新与发展。

本年度共设立8个技术方向,35项研究命题

申报截止时间为2020年6月15日24:00(北京时间)

申报链接:https://withzz.com/project/detail/73(请在PC端登录)

前两期我们介绍了机器学习、数字图像处理与计算机视觉

本期将介绍知识图谱与自然语言处理&语音信号处理与语音合成&密码学主题

欢迎海内外优秀青年学者关注并申报

三、知识图谱与自然语言处理

3.1 深度文本理解技术探索

文本理解技术被广泛应用于搜索、个性化推荐、广告匹配、智能对话等场景,用来对自然语言文本进行结构化分析与处理。随着近年来深度学习方法的兴起, 文本理解技术取得了很大的进步,但是在深度理解文本语义方面的能力和水平,跟人类相比还有较大差距。本命题研究和探索基于语义分析和知识推理的深度文本理解技术。

建议研究方向:

  1. 深层语义分析模型和技术;
  2. 文本理解的新模型和架构;
  3. 引入常识及外部背景知识的文本理解模型;
  4. 细粒度命名实体识别及其语义分析;
  5. 知识图谱的表示、构建和推理;
  6. 以及文本理解技术在相关场景中的应用。

3.2 信息安全领域知识图谱构建与应用

通用领域深度学习模型的可解释性差,且缺乏先验领域知识。知识图谱是一种可人工编辑的结构化知识载体,如果将这些知识融合到深度学习模型中,则能够有效提升模型的可解释性和可编辑性,使得模型能够根据具体业务场景进行人工定制。目前学术界和工业界均在知识图谱方面进行布局,并取得了显著成效。然而,各大公司将知识图谱视为内部资源而不愿意开源,导致可获得的高质量知识图谱较少。另一方面,针对信息安全这一特定领域,领域知识图谱将有助于改善各项下游业务的效果。因此,构建一个信息安全领域知识图谱是一项十分有必要的工作。

建议研究方向:

  1. 构建信息安全领域百万级的知识图谱;
  2. 研究知识图谱与深度学习模型融合的方法,解决模型解释性差的问题;
  3. 针对信息安全领域下游任务,提供基于知识图谱的解决方法。

3.3 医疗自然语言理解

医疗自然语言处理面临患者口述口语化、标注难度大、临床电子病历结构化等难题,我们希望通过医疗领域的自然语言理解技术,如:医疗知识图谱和医疗语言模型,来提升深度学习模型在健康助手、在线问诊、智能诊断等拥有大规模用户的产品中的表现。

建议研究方向:

  1. 医疗语言模型,知识蒸馏;
  2. 长文本分类,阅读理解,摘要生成,文本匹配;
  3. 问答系统、对话系统;
  4. 低资源的信息抽取和知识图谱扩增方法、医疗知识常识推理问答等。

3.4 多模态医学知识图谱

医学数据的信息化产生了大量的多模态数据,包括文本数据,图片数据,影像数据,时序数据等等。这些数据中蕴含着大量的知识,而目前没有被很好的挖掘利用。知识图谱是一种表达能力强、扩展性好的知识表示方式,能够兼顾人类认知与机器自动处理。如果能将医学多模态数据中蕴含的知识抽取出来,并且以知识图谱的形式表示,可以更好的支撑行业应用,例如基于知识图谱编码和路径的智能推荐、基于知识图谱实体关系的多轮对话系统等。

建议研究方向:

  1. 从海量的医学多模态数据中挖掘出知识,并且以知识图谱的方式进行表示抽象;
  2. 使用多模态知识图谱落地应用到实际的医学场景,包括基于知识图谱的医学文章推荐和患者多轮对话系统等。

3.5 面向K12阶段的教育领域AI技术研究

伴随着在线教育的持续发展,教育领域内相关计算机技术的应用进入“深水区”——从早期的“教育 互联网”逐步演进到“教育 AI”。教育领域内的应用,比以往任何时候更注重通过AI技术的运用来达成教育效率与教育效果的提升,进而推动教育公平的实现。本课题主要关注与K12阶段教育领域相结合的AI技术研究。

建议研究方向:

  1. 教育领域的基础NLP问题,包含且不限于词法分析、句法分析、篇章分析以及学科相关的语义理解(如数学公式理解);
  2. 教育领域的学科图谱构建,以及学科图谱与教育资源(习题、教案、教学视频等)的自动关联技术;
  3. 自适应学习技术,包含且不限于知识追踪、题目及学习资料推荐;
  4. 自动批改技术,包含且不限于作文批改、数学应用题批改以及问答题批改。

四、语音信号处理与语音合成

4.1 面向实时语音通信处理算法的客观质量评估

实时语音通信应用需要部署去混响、噪声消除、丢包补偿等各类算法应对由于环境影响或网络损伤带来的质量降低,而在精细化衡量各类算法效果和性能的过程中,作为主观评估方法的替代和补充,需要使用客观化的方法或方案,来贴近用户主观感觉,并降低评估的难度和提高评估结果的重复性。本课题将开展相关的前沿研究和工程技术创新,腾讯也将为项目提供丰富的落地实践场景。

建议研究方向:

  1. 研究衡量单通道/多通道去混响或抑噪算法效果的评价手段,以单一或者复合的指标以及可复现的评估方案来确定去混响/抑噪处理在提高声音质量和可懂度方面的性能;
  2. 研究衡量回声消除算法效果的客观评价手段,以单一或者复合的指标以及可复现的评估方案来确定算法处理的性能;
  3. 研究以无参考的方式来建模和评估被算法处理或丢包补偿之后的单向话音质量,提供新的方案来预测主观用户评估的结果。

4.2 多说话人多风格的高可控通用语音合成系统研究

现今大部分语音合成系统所涵盖的说话人及风格比较有限,当业务应用对特定嗓音及风格产生需求时,往往需要从头进行数据录取,标注及模型训练。此研究旨在扩大用于语音合成系统训练的数据规模并探索能够有效接受各类控制信号的模型结构及训练准则,构建出涵盖各类说话人音色及风格的通用语音合成系统。此系统在合成时能通过控制信号灵活合成出如朗读, 对话,傲娇,嗲声嗲气等各类语音。

建议研究方向:

  1. 扩大现今用于合成系统的训练数据规模,利用尽可能可以利用的数据,如语音识别数据,在线有声读物数据等;
  2. 研究能够有效接受各类控制信号的神经网络结构; 
  3. 研究能够充分利用各类风格控制监督信号的训练准则。

五、密码学

5.1 基于国密算法体系的密钥保护机制

对于密码学来说,在客户端如何保证密钥的安全存储是一个基础的应用场景,一般的密钥嵌入代码、文件加密存储方案都有泄漏的风险存在。更极致的做法是采用硬件KEY的方案,但是在移动设备场景或者现在流行的小程序场景,不太可能让用户随身携带硬件KEY。同时,2020年是国密密码法实施的第一年,国家以法律要求使用国密算法,但业界在这方面的成熟应用还比较欠缺,特别在类似web/小程序这种高风险的运行环境下,如何保障密钥安全,是一个很基础但又没有很好安全解决方案的需求,目前市场需求很大,具备很高的实用性。本课题希望结合基于国密算法体系的机制,在保证实现正常数据加解密,签名验签功能的前提下,在协同签名的基础上更进一步研究密钥保护机制,并符合GM/T 0028-2014 《密码模块安全技术要求》安全二级要求。

建议研究方向:

  1. 通过软件沙箱机制来隔离密钥数据;
  2. 基于同态加密、零知识证明等技术,在不泄漏密钥数据到内存的情况下实现加解密,签名验签;
  3. 协同签名的基础上进一步加强保护本地部分切割密钥的机制。

5.2 基于数据隐私保护的多方联合建模

随着产业数字化的推进,许多行业开始基于多方联合平台进行建模协作,特别是业界热门技术区块链平台。以区块链平台来说,在这个过程中,多方联合建模协作需要通过区块链的分布式账本技术实现多方联合建模,通过区块链访问参与方相关数据,但所访问的共享数据涉及到参与方的商业机密,且参与方又不希望敏感商业数据透露给对方。采用密码学做隐私保护是一个被广泛认可的研究方向,业界提出了零知识证明、安全多方计算、同态加密、密文等值测试等不同技术解决方案。本命题希望结合有明确隐私保护需求的特定业务场景,如多方联合建模风控、多方广告精准投放,通过采用密码学等技术,提出安全性和性能都符合商用标准的解决方案。

建议研究方向:

  1. 基于密文等值测试方案,实现云数据存储检索共享隐私保护;
  2. 基于区块链的分布式账本安全多方计算,在不透露参与方交易数据的情况下,实现两方以及多方协作建模风控体系;
  3. 广告精准投放协作过程中,如何在不暴露多方商业原始数据情况下进行可信计算和深度学习,以达到精准投放。

最后一期将介绍数据库&智慧交通&微众银行区块链与大数据主题

敬请期待

申报截止时间为2020年6月15日24:00(北京时间)

请扫描下方二维码或点击阅读原文了解项目更多信息

申报链接:https://withzz.com/project/detail/73(请在PC端登录)

CCF-腾讯犀牛鸟基金

期待您的加入

  • 往期课题介绍回顾
  • 2020年CCF-腾讯犀牛鸟基金课题介绍(一)——机器学习
  • 2020年CCF-腾讯犀牛鸟基金课题介绍(二)——数字图像处理与计算机视觉

0 人点赞