腾讯云数据库三篇论文入选行业顶会SIGMOD,产学研结合助力国产数据库生态建设

新型数据结构设计、AI智能调参优化等均属于业界首次提出

6月13日,腾讯云数据库三篇论文再次入选数据库行业顶会SIGMOD,被SIGMOD 2022 Research Full Paper(研究类长文)收录。

本次被收录的研究成果中,新型数据结构设计、AI智能调参优化等均属于业界首次提出。腾讯云数据库多次入选SIGMOD,表明腾讯云数据库在存储、智能管控等方面的积累与前沿创新获得了国际权威认可。

SIGMOD,全称数据管理国际会议(Special Interest Group on Management Of Data),是由美国计算机协会(ACM)数据管理专业委员会(SIGMOD)发起、在数据库领域具有最高学术地位的国际性学术会议。

第一篇入选论文题目为HUNTER: An Online Cloud Database Hybrid Tuning System for Personalized Requirements由腾讯云数据库团队和华中科技大学合作完成,在AI智能调参优化上取得进一步突破。

通俗理解,数据库的参数设置多达几百个,这些参数控制着数据库的性能表现。专业运维人员会花大量时间,根据经验来调优数据库的参数,以匹配不同硬件、需求和业务场景。如何利用 AI 技术解决数据库系统性能问题变得越来越重要和紧迫。

在此篇论文中,腾讯云数据库TDSQL-C团队提出了混合调优系统Hunter,主要解决了如何在保证调优效果的前提下显著减少调优时间的问题。实验表明:随着并发度提升实现调优时间准线性降低,在单并发度场景下调优时间只需17小时,在20并发度场景下调优时间缩短至2小时。

第二篇入选论文由中国人民大学和腾讯云数据库团队合作完成,题为CompressDB: Enabling Efficient Compressed Data Direct Processing for Various Databases,论文针对压缩数据的直接操作与处理,提出一项新型数据库处理技术——CompressDB。

面对当下指数级增长的数据量,行业普遍使用数据压缩来减少存储空间。在大数据管理系统中,直接在压缩数据上进行操作,可以获得存储空间的节约和处理性能的提升。但是,当前的此类系统只关注数据查询,而一个完整的大数据管理系统必须支持数据查询和数据操作。

本研究提出并实现了新型数据库技术,利用上下文无关文法来压缩数据,通过新的数据结构和算法设计实现对语法规则进行解析,CompressDB支持直接对压缩后的数据进行数据查询和操作,并且支持各种数据库系统。实验表明,CompressDB 平均达到40%的吞吐量提升和44%的延迟缩短,并实现1.81倍的压缩率。

第三篇入选论文由腾讯和北京大学合作完成,题为 BlindFL: Vertical Federated Machine Learning without Peeking into Your Data。针对数据隐私安全问题,该论文提出了一个新的纵向联邦学习范式BlindFL,可支持多种特征数据类型,且可以在半诚实安全假设下证明其安全性。实验结果表明,BlindFL可有效保护参与方的隐私数据,并具有更高的运行效率。

腾讯历来重视数据库领域的研发,通过校企联合实验室共建,面向青年学者的CCF-腾讯犀牛鸟基金,腾讯犀牛鸟科研专项等与高校、科研机构构建“产学研”一体的长期合作,将技术研究成果转换为应用落地,校企联合持续输出前沿技术创新与示范性应用。

此前,腾讯云数据库TDSQL曾多次亮相数据库三大顶会SIGMOD、ICDE、VLDB,以及数据科学领域的顶级期刊IEEE TKDE等。腾讯云数据库TDSQL将继续加大对数据库基础研究创新、数据库产学研合作生态的建设投入,充分释放领先技术的红利,助力国产数据库学术人才培养和技术创新生态建设发展。

版权所有,未经授权不得以任何形式转载及使用,违者必究。