写点什么

盈米基金与阿里云联合发布行业首个理财智能体评测集和投顾智能体模型

  • 2025-09-26
    广东
  • 本文字数:1957 字

    阅读完需:约 6 分钟

盈米基金与阿里云联合发布行业首个理财智能体评测集和投顾智能体模型

9 月 25 日,在 2025 云栖大会上,盈米基金与阿里云联合发布了国内首个财富管理领域的理财智能体评测集 FinMCP-Bench(以下简称 FinBench),以及能够像金融专家一样协同工具调用来处理复杂问题的投顾智能体模型 Dianjin-Qieman-FA-Agentic(以下简称 Dianjin-Qieman 模型)。

“随着大模型在财富管理领域的深化应用,财富管理公司都很关心自己的 AI 应用给客户提供的财富管理服务到底可以打几分,金融行业也一直在翘首以待一个专属这个行业的垂直应用大模型,FinBench 评测集和 Dianjin-Qieman 模型正是为了解决这两个问题而面世的。”盈米基金高级副总裁、且慢业务负责人林杰才对此充满了期待。

目前,这两大成果已在盈米基金旗下投顾服务平台——且慢 APP 上应用,并成为其 AI 大模型投顾服务且慢“AI 小顾”迭代升级的核心引擎。此次发布,不仅是为行业提供了 AI 模型可度量的权威标尺,更通过“评测集+大模型”的双轮驱动,为行业的智能化升级树立了从技术到应用的全新范式。

盈米基金联合创始人、高级副总裁兼 CTO 刘永表示,“此次与阿里云的 AI 全栈合作,旨在通过 AI 技术破解财富管理行业在智能化转型发展中遇到的瓶颈,通过这套基准评测集和专业大模型的方案,能让 AI 技术真正服务于投资者的个性化需求。”



(图从左往右:盈米基金联合创始人、高级副总裁兼 CTO 刘永和阿里云智能集团公共云事业部新金融行业线通义点金资深总监陈风)

 

AI 新标准,首个财富管理 AI 大模型“高考评价体系”面世

 

在生成式 AI 大模型与金融服务加速融合的背景下,金融机构普遍面临一道难题——由于金融服务领域的专业性、严谨性和对准确性的极高要求,通用的模型评测基准不足以全面评估大模型的金融服务能力。

目前,各类 AI 大模型在金融专业能力的差异,导致了机构在技术选型和应用评估的时候缺乏可靠的参考依据。

为破解这一行业难题,盈米基金携手阿里云共同推出了 FinBench。该评测集被业内人士形象地比喻为财富管理 AI 模型的“高考”,其本质是一套针对 AI 大模型在财富管理领域“工具调用”能力的量化指标体系,首次聚焦投顾服务中最核心、最关键的“工具调用”能力。

作为首个专注于财富管理领域的评测集, FinBench 区别于综合性金融大模型评测基准,更加聚焦于财富管理服务的核心能力,并紧贴客户的实际服务场景。

FinBench 的数据集源自“且慢”APP 用户的真实交互场景和高质量标注数据,深度还原了财富管理服务中的复杂场景,比如从客户的账户诊断到具体的资产配置建议等多样化、个性化的需求。

除了关注 AI 模型的语义理解能力和知识问答能力,FinBench 还首次将工具调用的准确性和投顾服务流程的规范性作为核心评测维度,以确保 AI 大模型不仅能“说得对”,还能“做得对”

此次 FinBench 的推出,为财富管理领域的 AI 研发和应用提供了一把可以度量的“标尺”。它不仅能为模型开发者提供清晰的能力优化方向,也为机构在 AI 大模型选择和应用开发上提供了具有价值的决策参考。

未来,FinBench 还将以开源共建的形式,帮助机构精准选择适配自己业务场景的 AI 模型,并以统一的标准来评估和优化 AI 应用,从而助力推动产业链的上下游共建智能服务新生态,加速行业的智能化升级进程。



(图中为盈米基金联合创始人、高级副总裁兼 CTO 刘永)

技术创新,能精准协同工具解决复杂问题的金融专家模型

 

如果说 FinBench 定义了“财富管理垂直 AI 大模型”的能力标准,那么 Dianjin-Qieman 模型则是一位能够高效运用工具来解决实际问题的“专业人士”,它能有效解决模型幻觉、数据质量、算力成本和技术成熟度等金融大模型常会遇到的问题。

该模型基于 Qwen3 研发,通过深度学习专家级的交互轨迹数据,建立了强大的工具调用底层逻辑,并引入多维度奖励机制,有效优化 AI 大模型在复杂场景下的长序列决策能力。

这也就意味着,AI 大模型不再是被动地回答用户提出的问题,它已经进化成一个能像“真人投顾专家”一样,主动理解用户意图、规划任务步骤,并协同精准调用“盈米基金且慢 MCP”的多种工具来完成复杂任务。若想体验 FinBench 与 Dianjin-Qieman 模型的应用效果,可以扫描以下二维码。



基于在且慢 APP 上的实测数据,Dianjin-Qieman 模型在工具调用准确率上优于大尺寸通用模型和金融大模型,且在降低算力成本的同时,其服务响应速度提升 50%。

这一技术的突破和模型的进化,标志着 AI 大模型投顾服务开始具备解决真实客户服务场景中复杂问题的能力,为提供更快、更精准、更稳定的智能化财富管理服务体验奠定了坚实基础,也为财富管理行业的智能化转型提供了可验证的技术范式。

此次盈米基金与阿里云的联合发布,通过“评测集+大模型”的创新模式,为财富管理行业的 AI 智能化转型发展探索出了一条清晰可行的发展路径。这将有助于机构提升在模型选型和金融应用研发上的效率和质量,从而助力推动财富管理行业的高质量发展,最终将优质、专业的财富管理服务惠及更广泛的投资者。如需了解方案的更多详情,可扫码获得:



用户头像

让每个人都能轻松构建专业级的金融AI应用 2023-10-29 加入

还未添加个人简介

评论

发布
暂无评论
盈米基金与阿里云联合发布行业首个理财智能体评测集和投顾智能体模型_盈米AI开放平台_InfoQ写作社区