openGauss-graph 0.1.0 版本正式发布
关系数据库数十年来的发展,证实了统一的数据模型和查询语言是数据管理技术发展的关键。目前,知识图谱数据管理的问题是数据模型、存储方案和查询语言不统一。为此,openGauss-graph 0.1.0 版本在今日正式上线。该项目由华为《基于 openGauss 关系型存储的图引擎》技术合作项目资助,由天津大学数据库实验室王鑫教授团队开发,是一个基于 openGauss 3.0.0 版本开发的统一模型和语言的知识图谱数据库管理系统。目前 openGauss-graph 0.1.0 已经发布在 openGauss 的 gitee 仓库。
openGauss-graph 0.1.0 仓库地址:https://gitee.com/opengauss/openGauss-graph/tree/0.1.0
图 1 openGauss-graph 仓库
01 系统架构
openGauss-graph 0.1.0
openGauss-graph 使用统一的存储方案,可以支持存储 RDF 图和属性图两种不同的知识图谱数据模型;根据实体的类型进行分块存储。分别提供 RDF 图和属性图上的查询接口,可以使用 SPARQL 和 Cypher 查询语言对同一知识图谱进行操作,即允许两种查询语言的互操作。在底层存储,使用相同的存储方案处理不同的知识图谱数据模型;在查询表达上,兼容两种语法完全不同,并且面向不同知识图谱模型的查询语言。而在查询处理上,将两种语法不同的查询语言对齐到统一的语义,进而使用同一面向图模型的查询处理引擎。图 2 为 openGauss-graph 的系统架构图。
图 2 openGauss-graph 系统架构图
02 统一知识图谱存储管理方案
openGauss-graph 0.1.0
1. 基于图空间的管理
支持同时管理多个图空间,随时在不同的知识图谱数据之间切换。
2. 兼容 RDF 图和属性图数据模型
基于 openGauss 行式存储,设计并实现了知识图谱存储管理方案,该方案能够同时兼容 RDF 图和属性图,并支持批量导入 RDF 或属性图数据。
3. 大规模知识图谱存储管理
支持大规模的知识图谱统一存储管理,目前已经导入包含亿级三元组的知识图谱数据,并能够在上面高效地执行查询。
03 知识图谱数据库查询处理方法
openGauss-graph 0.1.0
1. 兼容 SPARQL 和 Cypher
兼容 RDF 图数据模型的查询语言 SPARQL 和属性图数据模型的主流查询语言 Cypher 的查询语法, 进行两种查询语言的语义对齐,实现两种查询语言的互操作,可使用两种语言操作同一个知识图谱。
2. 查询性能达到主流水准
与原生图数据库对比查询性能,对于单点和三跳以上的查询,性能表现更优。
04 快速入门
openGauss-graph 0.1.0
参阅快速入门,查看 openGauss-graph 0.1.0 支持的全部内容。
https://gitee.com/opengauss/openGauss-graph/blob/0.1.0/doc/quick_start.md
图 3 快速入门示例
天津大学数据库实验室王鑫教授团队
天津大学数据库实验室王鑫教授团队长期从事图数据管理与知识图谱数据相关研究,曾获得“CCF-华为数据库创新研究计划”首批资助并在验收获得第一名,开发了统一数据模型和查询语言的知识图谱数据库。目前从事国家重点研发计划项目“分布式知识图谱数据管理关键技术与系统”,国家科技创新 2030“新一代人工智能”重大项目,“亿级节点时序图谱实时智能分析关键技术与系统”子课题,国家自然科学基金面上项目“大规模知识图谱分布式存储与查询关键技术研究”等项目的研究。在国内外学术会议和期刊发表学术论文 200 余篇。
评论