OpenSPG/KAG v0.6 发布,兼顾事实推理与摘要生成,支持用户自定义 Schema2025
OpenSPG 是一个语义增强的可编程知识图谱:https://github.com/OpenSPG/openspg
KAG 是一个知识增强生成的专业领域知识服务框架,KAG 依赖 OpenSPG 提供的引擎依赖适配、逻辑推理执行等能力:https://github.com/OpenSPG/KAG
🌟 欢迎大家 Star 关注~
2025 年 1 月 7 日,OpenSPG/KAG 正式发布 v0.6 版本,此次发布带来多个功能更新,包括摘要生成类任务支持、垂域 Schema 管理、可视化知识探查等;用户体验上,提供知识库任务的断点续跑机制,新增用户登录与权限体系、优化构建任务调度;开发者模式下支持不同阶段配置不同模型、支持 schema-constraint 模式抽取等,极大地提升了系统的灵活性、易用性、性能和安全性,为用户提供一个更加强大,且适应多样化应用场景的知识管理平台。
新增功能
1、摘要生成类任务支持
不牺牲多跳事实推理精度的情况下,原生支持摘要生成任务。
在 CSQA 数据集上,全面性、多样性、赋权性等指标弱于 LightRAG (-1.2/10),事实性指标优于 LightRAG(+0.1/10);在 hotpotqa, twowiki, musique 等多跳问答数据集上,鉴于 LightRAG、GraphRAG 均未提供事实问答的测评入口,使用默认入口测试 EM 指标接近 0。
KAG 量化评测结果,可参考 KAG 代码仓库 examples/csqa/READEME.md 按步骤复现。
2、领域 Schema 管理
产品侧提供 SPG Schema 管理能力,支持用户根据通过自定义 Schema 以优化知识库构建 &推理问答的效果。
3、知识探查
新增知识探查功能,实现知识库数据的可视化查询分析,并提供 HttpAPI 与其它系统对接。
4、知识库构建支持挂载领域知识(开发者模式)
开发者模式下,支持将领域知识(领域词汇、词条间关系)注入知识库中,可显著提升知识库构建、推理问答效果(医疗场景下有 10%+ 的提升)。
5、构建链路增加知识对齐组件
KAG-Builder 提供默认的知识对齐组件,并内嵌无效数据过滤、相似实体链指等功能,以优化图谱的结构和数据质量。
用户体验优化
1、断点续跑
产品模式、开发者模式下,分别提供文件级别、Chunk 级别的知识库构建任务的断点续跑能力,以降低任务失败后全量重跑所带来的时间和 tokens 消耗。
2、用户登录 &权限体系
提供用户登录 &权限体系,防止未经授权的知识库数据访问和操作。
3、知识库构建任务调度优化
提供基于数据库的知识库构建任务调度能力,避免容器重启后任务异常或者中断。
4、支持不同阶段配置不同模型(开发者模式)
提供基于注册器的组件管理机制,允许用户通过配置文件实例化组件对象,支持用户开发 &嵌入自定义组件到 KAG-Builder、KAG-Solver 工作流 中,同时在工作流的不同阶段配置不同规模的大模型,以提升整体的推理问答性能。
5、Markdown、PDF、Word 文件版面分析优化
Markdown、pdf、word 等文件优先根据文件章节划分 Chunk,以实现同一 chunk 的内容更内聚。
6、项目全局配置及知识库配置
提供知识库全局配置功能,统一设置存储引擎、生成模型、表示模型的访问信息。
7、支持 Schema-constraint 模式的抽取链接(开发者模式)
提供 Schema-constraint 模式,知识库构建阶段,严格按照 Schema 的定义进行操作,从而实现更细粒度和更复杂的知识抽取。
未来规划
更多的效果量化榜单发布(包括医疗、事理图谱、金融研报等场景的知识推理);
复杂推理能力,子问题级领域知识精准注入,持续提升检索、推理的覆盖率和准确率;
产品体验持续提升。
目前 KAG 还处于早期阶段,诚邀对知识服务和知识图谱技术感兴趣的用户和开发者加入我们,共建新一代 AI 引擎框架。我们建立了 OpenSPG 技术交流群,欢迎大家添加小助手微信加入:jqzn-robot。
评论