MatrixOne Intelligence v3.3 正式发布:结构化、自动化、可视化三重进化

MatrixOne Intelligence 介绍
MatrixOne Intelligence 是一套面向多模态数据的 AI 数据智能平台,旨在帮助企业应对数据碎片化、多模态数据整合复杂、GenAI 应用落地困难等挑战。通过数据接入、智能解析、数据工作流、超融合的湖仓底座,MatrixOne Intelligence 为企业提供了一站式的端到端平台,将企业内部的自有数据变成可以服务于 GenAI 落地应用的 AI-Ready 数据。该平台基于创新的云原生架构和存算分离设计,支持结构化和非结构化数据的统一管理和高效处理,具备高度灵活的部署能力,可适配公有云、私有云及本地数据中心的多种环境。
MatrixOne Intelligence 致力于帮助企业充分挖掘和释放私域数据的潜能,让企业私域数据在 AI 时代得到充分利用,成为其独特竞争力的关键来源。
一、工作流能力全面升级:更灵活、更智能
为提升数据处理的模块化与灵活性,新版本对工作流节点进行了重点增强:
新增结构化提取节点:该节点结合 LLM 与 JSON Schema 标准,能够对非结构化文本内容进行智能识别与字段提取,自动生成规范的结构化数据,显著提升处理效率。用户可借此实现从原始文档到可直接用于分析、检索或系统对接的数据自动转换,降低人工处理成本,加快业务自动化进程。为方便快速集成,同步推出了相关的快速开始 API,助力企业快速落地结构化数据应用。
文本嵌入节点独立:将原解析节点中的文本嵌入功能拆分为独立的文本嵌入节点,提升了解析流程的模块化与灵活性,便于用户按需组合调用 。
数据增强节点支持更多数据集格式:新增对 ShareGPT Format、OpenAI Format 及自定义格式的输出支持,同时支持定义生成风格。用户可通过可视化界面灵活配置,快速构建符合不同模型训练需求的数据集。该能力显著降低了数据准备的技术门槛,提升了数据生成的效率与灵活性,帮助用户在多样化的下游任务中实现更高质量的数据驱动训练,缩短模型迭代周期,加速 AI 应用落地。
文本分段方式更加多样:文本分段节点现支持按单个、多个及自定义标志符进行分段,以实现更精准、高效的文本切分操作 。

二、GenAI 工作区更智能,任务处理自动化
GenAI 工作区现已全面支持 MCP 协议 ,这意味模型可通过 MCP 协议以标准化方式调用平台 API,自动识别意图并拆解任务,智能调度多种能力完成复杂任务链。平台智能性进一步提升,用户仅需输入目标即可驱动多工具协同完成数据处理。
三、解析结果升级:可视化增强,结果更有“说服力”
在处理效果可解释性与准确性方面,新版本重点加强了解析结果的直观呈现能力:
增强文档标题识别能力:新版本对标题结构识别精度显著提升,除了准确识别一级标题外,部分复杂文档中也可识别二级和三级标题,有效还原文档层次结构,为后续的内容抽取与知识建构提供坚实基础。
支持原文高亮对照查看:用户可以在原始 PDF 文档中高亮查看字段对应内容,实现解析结果与页面布局的直观比对,快速定位潜在问题、判断模型表现,提升数据处理的透明度与信任度。

四、官网体验中心上线:核心能力零门槛体验
为了让您更快速地了解 MatrixOne Intelligence 在文档解析领域的强大能力,官网体验中心首个 Demo 正式上线!
三大核心功能开放体验 :我们集成了结构化抽取、文档解析和文档对话三大核心功能 。您无需登录,即可使用样例数据,直观体验系统如何精准提取关键字段、深度解析复杂文档,并通过智能对话快速获取信息 。
手机号快捷注册登录 :想上传自己的数据测试?只需手机号即可快速注册,快速完成登录和文档上传,立即体验数据向 AI 能力转化的全过程。

五、数据导出新能力:与 Dify 知识库无缝集成
新增数据导出连接器功能,现已支持将平台处理后的数据一键导出至 Dify 知识库。通过与 Dify 的无缝对接,用户无需进行复杂的格式转换或手动迁移,即可高效构建和持续更新知识库。该功能不仅显著缩短了知识库搭建周期,还提升了数据流转的自动化程度,帮助用户更快速地将高质量数据应用于智能问答、知识检索等场景,大幅提升知识的生产力和使用效率。

六、使用体验全面优化:细节决定体验
新版本在操作体验方面进行了多项打磨优化,全面提升用户交互流畅度:
工作流界面优化,操作体验更顺畅
创建流程校验逻辑优化,提升规范性与稳定性
本地文件上传界面调整,更加直观清晰
文本分段节点显示优化,更好体现 type 与 level 信息
API 使用流程优化,增强用户视角理解,新增告警相关 API
文件与图片解析节点新增 OCR 与图片描述开关,支持图片描述中英文切换,让多模态数据处理更灵活、更可控
评论