写点什么

度小满”轩辕”系列发布 12 款金融大模型,金融实战能力出色

作者:科技热闻
  • 2024-03-11
    浙江
  • 本文字数:954 字

    阅读完需:约 3 分钟

3 月 11 日,度小满宣布“轩辕”系列金融大模型新增开源 6B、13B、70B 三种参数 12 款金融大模型。这 12 款大模型具有“以小搏大”的实力,在用户信息分析、业务数据洞察等十余种金融实际任务评测中,达到自身 2 倍甚至 5 倍参数量的模型水平。

三种参数的基座模型、对话模型、int4 量化模型、int8 量化模型完全开源,开发者可在 GitHub、HuggingFace、Model Scope 等开源社区内下载使用。

在“轩辕”模型矩阵中,70B 及以上模型适合针对需要深度分析、复杂指令执行以及全方位 Agent 调用的场景,而 6B、13B 的模型则更加适用于对响应速度有高要求、面向小规模场景和单任务的应用。”轩辕”6B-4-bit 量化 Chat 模型则以其低推理部署成本,进一步降低大模型的应用门槛。

专注中文金融领域任务 FinanceIQ 大模型金融自动评测集显示,在注册会计师(CPA)、银行从业资格、基金从业资格、证券从业资格等多项金融领域考试中,“轩辕”展示出金融领域专家的水平。



(“轩辕”系列大模型拥有远超同参数水平的金融能力)

“轩辕”系列大模型在训练方式上进行了多项创新,例如将人类偏好对齐技术引入了金融大模型训练。通常多数垂类大模型仅在微调阶段引入特定领域数据,但这种方法在实际应用中常常显示出局限性,金融行业的复杂性要求模型能够更深入地理解并适应行业特定的需求。为此,度小满构建了涵盖通用性、安全性和金融特性的 Prompt 数据集,并组织了专业的标注团队对成对的回答进行偏好标注,从而收集到了一批高质量、广覆盖的偏好数据,并通过一系列实践、分析和改进成功完成了奖励模型和后续的强化训练。

度小满在 2023 年 5 月开源国内首个千亿级中文金融大模型“XuanYuan-176B”。2023 年 9 月,“XuanYuan-70B”大模型在 C-Eval 和 CMMLU 两大权威榜单上位列所有开源模型榜首。本次度小满”“轩辕””模型矩阵再次升级,十亿-百亿-千亿参数全覆盖,实现多场景任务适配。

业内普遍认为,金融大模型的价值体现在其能否在核心业务场景中发挥实际作用,如通过综合分析用户信息以支持风险评估、刻画客户画像等。目前,”轩辕”金融大模型已经应用在度小满各个业务场景,从营销、客服、风控、办公再到研发,已经初见成效。在代码助手方面,用大模型辅助生成的代码,采纳率能够达到 42%,帮助公司整体研发效率提升了 20%;在客服领域,大模型推动服务效率提升了 25%。

“轩辕”大模型 Github 下载地址:https://github.com/Duxiaoman-DI/XuanYuan

用户头像

科技热闻

关注

还未添加个人签名 2021-05-31 加入

还未添加个人简介

评论

发布
暂无评论
度小满”轩辕”系列发布12款金融大模型,金融实战能力出色_科技热闻_InfoQ写作社区