电影届有个奥斯卡奖,是国际上最具权威和专业性的电影类奖项。如果能拿到这个奖项,就代表你的演技已经走出国门,受到全世界的认可甚至喜爱。
而数据库领域,也有一个类似的“奖项”,那就是 SIGMOD 会议。
SIGMOD 会议全称 ACM SIGMOD 数据管理国际会议,是由美国计算机协会 (ACM) 数据管理专业委员会发起、在数据库领域具有最⾼学术地位的国际性学术会议。一直以来,中国学者的论文被 SIGMOD 接收的比例都很小,中国万维⽹联盟上的⼀个分析报告指出:截止到 2006 年,SIGMOD 上共接收了 1790 篇论⽂,⽽其中属于中国⼤陆学者的就 9 篇,占⼤约 0.5%。
不过,随着近两年我国逐渐重视科学研究,中国学者的论⽂在 SIGMOD 上的数量也在不断增加。今年,腾讯云联合北京大学、中国人民大学、华中科技大学等多所高等院校,共同开展学术研究,多篇论文被顶级会议 SIGMOD、VLDB、WWW 等收录。
6 月 21 日 15:00,腾讯云数据库将举办 DB TALK 论文在线解读会,邀请业界专家就近期被顶会收录的论文展开解读,如果你想掌握最前沿的数据库技术和发展方向,这场解读会千万不可错过!
1 论文解读:推动数据库领域发展的三大技术
本次 DB TALK 论文在线解读会,腾讯云数据库将会邀请包括论文作者在内的领域专家,为你带来以下三篇论文的深度解析:
1、基于压缩数据直接计算技术的数据库系统研究 | SIGMOD 2022
大数据时代,传统的关系型数据库无法满足现在以数据为中心的大数据管理的需求,因此,设计新型大数据管理系统迫在眉睫。为了节约存储空间,一个完整的大数据管理系统需要同时支持数据查询和数据操作,但是,当前的此类系统只支持数据查询。
本次解读会,中国人民大学副教授、博士生导师、腾讯犀牛鸟基金获得者张峰老师将为你解读论文《CompressDB: Enabling Efficient Compressed Data Direct Processing for Various Databases》。
论文介绍了在大数据管理系统中,如何通过新型数据库处理技术 CompressDB 直接在压缩数据上进行数据处理,使其提升处理性能。最后经实验证明,CompressDB 平均已经达到了 40% 的吞吐量提升和 44% 的延迟缩短,并实现 1.81 倍的压缩率。
2、面向个性化需求的在线云数据库混合调优系统 | SIGMOD 2022
数据库作为企业 IT 架构至关重要的一环,需要专业的运维人员耗费大量时间、精力来手动管理和维护,或者对数百个影响数据库性能的参数进行调优。
然而,不同的硬件配置、不同的工作负载对应的参数文件都是不同的,运维人员不能直接使用之前调好的参数文件。因此,数据库调优十分困难且复杂,一旦出错,就会给数据库正常运行时间、性能和安全性带来毁灭性影响。
因此,如何利用 AI 技术解决数据库系统性能问题变得越来越重要和紧迫。
华中科技大学教授、信息存储系统教育部重点实验室副主任周可老师,将在本次会议上,带来论文《HUNTER: An Online Cloud Database Hybrid Tuning System for Personalized Requirements》的解读。
在此篇论文中,腾讯云数据库 TDSQL-C 团队针对核心问题“如何在保证调优效果的前提下显著减少调优时间”,提出了混合调优系统 Hunter。其不仅可以提升单个任务的调优效率,在并行调优上也下了不少功夫,尽力节省时间成本,最后达到在单并发度场景下调优时间只需 17 小时,在 20 并发度场景下调优时间缩短至 2 小时的效果。
3、可扩展的图神经结构搜索系统 | WWW 2022
目前,不论是宏观上的互联网、知识图谱,还是微观上的蛋白质、化合物分子都可以用图结构来建模或表示,可以说,图结构数据已经成为现实生活中广泛存在的一种数据形式。而图神经网络,是一种可以直接对图结构数据进行学习的框架,其优异的性能引起了工业界与学术界共同的关注。
然而,现有的图神经网络系统有两个技术壁垒:一方面,大多数基于消息传播机制的图神经网络模型可扩展性较低,很难直接用于工业界大规模图数据;另一方面,现有的图神经网络系统需要用户针对特定图数据和图任务编写代码和训练流程,这就需要经验丰富的专家来设计网络结构,提高了建模成本。
腾讯 TEG 机器学习平台部 Angel Graph 团队应用研究员、北京大学计算机系在读博士生张文涛老师将在本次会议上解读论文《PaSca: a Graph Neural Architecture Search System under the Scalable Paradigm》。
该论文提出了一个非常新颖的图神经网络建模范式,基于该范式,团队设计了一个可扩展的图神经结构搜索空间,为图神经网络可扩展性的相关研究指明了一个新的方向和路线。此外,该文还实现并开源了一套多目标(如模型预测效果和资源占用)自动化图神经结构搜索系统,来支持更简单和更高效的大规模图学习。
2 圆桌会议:探讨数据库领域的下一个风口
除了以上论文解读,我们还邀请了上述参会嘉宾共同参与圆桌会议,对以下议题进行深度探讨:
- 数据库的下一个技术风口是什么?接下来面临哪些挑战?
- 从最新的技术研究诞生,到成功落地应用推动经济发展,有哪些成熟的经验可以借鉴?
- 数据库技术发展如何做好产学研协同?企业、高校、学会组织怎样发挥各自优势?
- 未来我国数据库人才培养应该朝什么方向努力?
现在,我们对所有数据库方面的从业者发出邀请,6 月 21 日 15:00,和业内专家来一场科技与发展的思想碰撞!扫描海报二维码或点击阅读原文,即刻报名参会!
点个在看少个 bug