NineData ChatDBA 发布重大更新，准确率飙升

2024-11-26
浙江
本文字数：1164 字
阅读完需：约 4 分钟

自从 2022 年年底 ChatGPT 开始普及以来，生成式 AI 服务遍地开花，工信部的数据表明，截止 2024 年 10 月，中国的生成式 AI 服务大模型注册用户已超过 6 亿，以惊人的速度渗透到各个领域。在这期间，NineData 也推出了聚焦于数据库领域的大模型【ChatDBA】，对其进行了大量针对性的数据库知识训练。上线后，发展了大批忠实用户。

在生成式 AI 领域，有一种现象被称为“AI 幻觉”（AI Hallucination），即 AI 提供的回答往往语气坚定，信心十足，但答案却和真实情况相去甚远。如果因此对答案深信不疑，那么很容易就被忽悠了。不幸的是，这种”已读乱回”现象的出现概率非常之大。

在企业场景下，生成式 AI 通常被用来提升工作效率和企业生产力，但是大部分情况下，通用大模型的训练数据并不足以带来显著的生产力提升。再举个例子，企业的技术支持部门面对客户提出复杂的技术问题时，生成式 AI 可能会基于通用训练数据生成答案，提供表面看似合情合理的建议。然而，由于未能结合企业内部的技术文档或故障排查记录，这些答案往往是错误的，非常容易误导客户。

上述的两个问题，本质原因都是由于通用大模型不具备特定领域知识的训练数据，要有效利用生成式 AI，将企业知识库与生成式 AI 进行集成是一个可行的方案，但得先有一个合理的方式。一次性将所有的知识全塞给 AI，理论上可行，但企业知识库往往是一个庞大的“信息堆积地”，大模型不可能一次性加载所有内容，不仅如此，输入和输出的 token 可是烧钱的一把好手。

针对这个短板，NineData 为 ChatDBA 产品进行了重大升级，其可以支持对接企业自有的知识库，进一步增强私域数据的高效、精准问答能力。

NineData ChatDBA 简介

NineData 支持构建和管理企业私有知识库，配合 ChatDBA 高效获取内部知识内容，提升信息检索效率和准确性。NineData ChatDBA 具备如下特性：

智能化检索机制：基于用户提问，通过语义理解快速检索出知识库中最相关的内容。相比传统的关键词匹配方式，语义检索可以更好地理解问题的上下文含义，提升检索结果的相关性。
动态集成与实时生成：检索到相关知识后，ChatDBA 将结果动态传递给大模型，大模型基于这些内容生成答案，而无需加载整个知识库。
支持多种格式知识库：支持上传 PDF、WORD、EXCEL、TXT 等常用的文本格式，覆盖多种数据格式场景。