攀登不止,华为数据库论文入选 SIGMOD 2024,技术创新再谱新篇
本文分享自华为云社区《攀登不止,华为数据库论文入选SIGMOD 2024,技术创新再谱新篇》,作者:GaussDB 数据库。
6 月 9 日-14 日,2024 年数据管理国际会议 SIGMOD(ACM SIGMOD/PODS International Conference on Management of Data)在智利首都圣地亚哥召开。SIGMOD 与 ICDE、VLDB 并称数据库领域三大顶会,是数据管理领域的最高水平学术会议。继 ICDE 17 篇论文入选后,华为多篇论文再次入选 SIGMOD 2024, 顶会入选论文已超过 100 篇。下面节选数据库领域的两篇代表性论文进行分享:
论文一:Robustness of Updatable Learning-based Index Advisors
该论文详细探讨了学习型索引推荐(Learning-based Index Advisors, IA)在面对投毒攻击时的鲁棒性问题。在这种攻击中,攻击者通过向系统输入恶意数据来扰乱 IA 的学习过程。
论文的核心贡献在于提出了一个名为 PIPA 的框架,它包括两个主要阶段:
探测阶段:在这一阶段,系统会通过特定的工作负载来探测 IA 的行为,从而估计其对不同索引的偏好。这是通过观察 IA 对探测工作负载的响应来实现的,目的是识别出 IA 可能被投毒攻击影响的脆弱点。
注入阶段:在这一阶段,系统会尝试通过注入特定的工作负载来欺骗 IA,使其降低对 top 索引的排名,同时提升中等排名的索引。这样做的目的是为了测试 IA 在受到投毒攻击时的反应能力和恢复能力。
综合这两个阶段,PIPA 框架能够有效地对 IA 进行测试,即使在 IA 经过微调后,也能够捕获其对投毒攻击的敏感性。SIGMOD 评委组认为,这项研究的意义不仅提高了 IA 的安全性,还增强了其在实际应用中的可靠性,为未来的学习型索引推荐提供了重要的参考,特别是应用在云数据库场景中。
论文二:ESTELLE: An Efficient and Cost-effective Cloud Log Engine
该论文是由电子科技大学和华为云数据库创新 LAB 团队联合攻关发表,提出了一个低成本的云原生日志引擎,解决了海量日志场景下现有解决方案成本较高的问题。
1. 本文提出了一个名为 ESTELLE 的低成本云原生日志引擎,可以高性能、低开销的写入、存储及查询日志
2. 本文介绍了一种可插拔的日志索引框架,基于 ESTELLE-BF 和近似倒排索引实现,可以低成本的写入生产,并可以实现高性能的日志全文检索、AND 查询及渐进式聚合分析
3. 本文在真实的开源日志数据集上进行试验,证明了 ESTELLE 在不同日志场景中较高的单核写入能力、较低的存储成本及良好的查询性能
综上,本文提出了一个高性能、低成本的云原生日志引擎 ESTELLE,可以在海量写入、低频查询场景下,通过较低的成本,实现较好的日志引擎能力。
此次论文的入选,既是华为在数据库领域持续创新、研发投入的成果,也是华为长期坚持产、学、研、用深度融合的体现。华为通过与全球顶尖学术机构合作,持续推出各类研究计划和人才培养方案,共同攻克数据库难题。
未来,华为将继续加大数据库技术领域的投入,在数据库领域持续创新,将论文理论转化成应用落地,为客户提供创新且有竞争力的数据库产品和服务,推动数据库技术的进步与发展。
版权声明: 本文为 InfoQ 作者【华为云开发者联盟】的原创文章。
原文链接:【http://xie.infoq.cn/article/70b7a8c37cb6fe65be01ae0bf】。文章转载请联系作者。
评论