NineData ChatDBA 发布重大更新,准确率飙升
自从 2022 年年底 ChatGPT 开始普及以来,生成式 AI 服务遍地开花,工信部的数据表明,截止 2024 年 10 月,中国的生成式 AI 服务大模型注册用户已超过 6 亿,以惊人的速度渗透到各个领域。在这期间,NineData 也推出了聚焦于数据库领域的大模型【ChatDBA】,对其进行了大量针对性的数据库知识训练。上线后,发展了大批忠实用户。
在生成式 AI 领域,有一种现象被称为“AI 幻觉”(AI Hallucination),即 AI 提供的回答往往语气坚定,信心十足,但答案却和真实情况相去甚远。如果因此对答案深信不疑,那么很容易就被忽悠了。不幸的是,这种”已读乱回”现象的出现概率非常之大。
在企业场景下,生成式 AI 通常被用来提升工作效率和企业生产力,但是大部分情况下,通用大模型的训练数据并不足以带来显著的生产力提升。再举个例子,企业的技术支持部门面对客户提出复杂的技术问题时,生成式 AI 可能会基于通用训练数据生成答案,提供表面看似合情合理的建议。然而,由于未能结合企业内部的技术文档或故障排查记录,这些答案往往是错误的,非常容易误导客户。
上述的两个问题,本质原因都是由于通用大模型不具备特定领域知识的训练数据,要有效利用生成式 AI,将企业知识库与生成式 AI 进行集成是一个可行的方案,但得先有一个合理的方式。一次性将所有的知识全塞给 AI,理论上可行,但企业知识库往往是一个庞大的“信息堆积地”,大模型不可能一次性加载所有内容,不仅如此,输入和输出的 token 可是烧钱的一把好手。
针对这个短板,NineData 为 ChatDBA 产品进行了重大升级,其可以支持对接企业自有的知识库,进一步增强私域数据的高效、精准问答能力。
NineData ChatDBA 简介
NineData 支持构建和管理企业私有知识库,配合 ChatDBA 高效获取内部知识内容,提升信息检索效率和准确性。NineData ChatDBA 具备如下特性:
智能化检索机制:基于用户提问,通过语义理解快速检索出知识库中最相关的内容。相比传统的关键词匹配方式,语义检索可以更好地理解问题的上下文含义,提升检索结果的相关性。
动态集成与实时生成:检索到相关知识后,ChatDBA 将结果动态传递给大模型,大模型基于这些内容生成答案,而无需加载整个知识库。
支持多种格式知识库:支持上传 PDF、WORD、EXCEL、TXT 等常用的文本格式,覆盖多种数据格式场景。
实操
1. 将企业的知识库文档上传至 NineData。
2. 等待系统完成文档解析,即状态达到已完成。
3. 开启 ChatDBA,提问包含知识库内容的问题。
4. 单击查看知识来源,可以查看到 ChatDBA 引用了哪些知识库片段的内容。
总结
NineData ChatDBA 通过智能化语义检索和动态内容集成,将知识库检索这一繁杂无序的工作直接扔给了 AI 去干,让企业的文档不再是“信息的堆积地”,而是成为企业的智能中枢。不仅解决了通用大模型在特定领域中的不足,还降低了企业在知识管理上的时间和成本投入,可谓一举两得。
评论