客户案例 | 某大型综合性券商借助白鲸开源产品打造全链路智能调度与数据集成平台

在数字化转型加速的今天,金融行业正面临前所未有的数据挑战:数据量指数级增长、任务调度日益复杂、数据源类型多样化、处理链路不断延长。某证券公司,作为国内领先的综合性券商,面向内部高强度的 IT 运维与业务流程自动化需求,构建了覆盖调度控制与数据集成的双引擎体系。
借助 白鲸开源推出的 WhaleScheduler 和 WhaleTunnel 两大核心产品(包含在 WhaleStudio 中),该证券全面构建了从任务调度控制到非结构化数据集成的智能化基础平台,实现了数据驱动下的业务提效与系统升级。
背景与挑战:调度与数据处理的双重压力
📌 任务调度挑战:
每日处理 数百万级任务实例,高峰时期任务量激增;
部署有 多个 Master 节点、多个 Worker 节点,需实现资源感知与弹性伸缩;
任务类型复杂,SQL/Shell/HTTP 占主流,业务链路依赖性强;
缺乏全局可视化、智能调度与动态扩容机制。
📌 数据集成挑战(非结构化为主):
超过 80% 的业务数据为 非结构化:PDF、扫描件、语音、自由文本;
涉及文档识别、语义理解、知识提取、图谱构建等 AI 全流程;
识别结果难以高效流入企业数据湖或数据库,存在“处理结果孤岛”问题;
多源数据难整合、更新不及时、业务无法实时响应。
解决方案:WhaleScheduler × WhaleTunnel 双引擎架构
为应对以上挑战,该券商全面引入白鲸开源的两大核心产品:

该券商 WhaleStudio 解决方案
✅ WhaleScheduler:企业级智能调度平台
WhaleScheduler 是由白鲸开源全力打造的一款自主可控、安全可靠的商业化调度产品,具备强大的任务编排与执行能力,广泛应用于金融、电信、制造等关键行业。产品在架构设计与兼容性方面高度贴合信创要求,已实现对国产 CPU(如鲲鹏、飞腾)、国产数据库(如达梦、人大金仓)及国产操作系统(如麒麟、中标麒麟)的深度适配,全面满足政企用户在信创环境下对稳定性、安全性与高性能的严苛要求,是推动国产化替代的重要调度平台选择。
基于 WhaleScheduler,该券商构建了自主可控、覆盖核心业务的高可用调度体系,适配金融级 SLA 要求和 IT 基础设施和生态系统完全国产化信创要求。
支持 DAG 工作流编排、失败重试、分支逻辑等复杂调度;
高并发调度 + 异构资源感知;
动态扩容 Master/Worker;
可视化运维 + 多维监控告警;
与 SQL、Shell、Python、DataX、SeaTunnel 等执行器无缝集成。
✅ WhaleTunnel:企业级数据集成平台
WhaleTunnel 是白鲸开源打造的企业级数据集成平台,具备灵活可扩展、批流一体、多源异构的数据同步与整合能力,全面满足复杂数据环境下的集成需求。产品深度适配信创生态,现已支持 290+ 数据源接入,能够在信创环境中稳定运行,
WhaleTunnel 助力该券商客户实现了高效、安全、可控的数据流转与治理:
对接 290+ 数据源,包括国产数据库(如 TDSQL、GoldenDB、南大通用、达梦、GaussDB)、主流对象存储、消息队列、API 接口等;
支持结构化和非结构化数据同步;
提供任务级监控、容错与断点续传;
与 WhaleScheduler 集成,支持自动调度、实时触发。
平台落地实践:调度与集成融合推动智能运营
🎯 核心场景一:基于 WhaleScheduler 打造千万级任务调度平台
该券商构建了两套基于 WhaleScheduler 的调度集群,分别支撑日常任务与估值核对等关键业务:
✅ 定时任务调度集群
日均执行任务数:203 万+
管理工作流:9 万+ / 日
涉及数据同步、归档、计算、指标落地等作业
元数据存储于 TiDB,保证高可用性
✅ 估值核对调度集群
管理估值、对账、校验等关键数据任务链;
精准 SLA 控制,秒级任务触发;
协同 ORACLE、TiDB、OceanBase 等多源系统
🚀 调度系统成效:
吞吐能力提升 3 倍以上;
无任务堆积,响应时间显著缩短;
支持任务链路可视化、扩容自如;
运维效率全面提升。
📚 核心场景二:基于 WhaleTunnel 构建非结构化数据集成平台
该券商构建了公司级非结构化数据处理平台,涵盖 文档解析、语义理解、知识图谱、智能检索 四大能力模块。
WhaleTunnel 成为连接 AI 模块输出与数据资产平台之间的“最后一公里”桥梁,解决了解析结果落地难、数据流转断裂等难题:
✅ 表单识别自动化
将 OCR + 模板识别结果通过 WhaleTunnel 自动导入数据库;
每单处理耗时从分钟级降至秒级,识别准确率达 95%+;
与估值、风控系统实时联动,支撑业务实时响应。
✅ CRM 智能语音助手
通过 WhaleTunnel 实现用户语音意图转化结果与数据服务系统联通;
实现自然语言转 SQL 查询与语义解释返回。
✅ 企业知识图谱与搜索引擎
构建研报库、规章制度库等知识库;
解析内容由 WhaleTunnel 自动同步至 Elasticsearch 和图数据库;
支持全文检索、语义推荐、血缘追溯。
✅ 元数据血缘图谱构建
提取 SQL 语句中的字段依赖关系;
通过 WhaleTunnel 将数据结构与关系写入图数据库;
实现“影响分析”、“溯源分析”能力,支撑数据治理合规。
🚀 集成平台成效:
跨系统数据打通,形成知识闭环;
数据更新周期从天级缩短至秒级;
处理结果精准落地,服务业务实时决策。
未来展望:迈向智能金融调度与数据中台
该券商借助 WhaleStudio 打造的调度与数据集成一体化平台,不仅实现了系统架构升级、业务效率提升,更为后续智能分析、自动化决策打下坚实基础。
白鲸开源也将持续推动产品向“智能调度 + 实时集成 + AI 赋能”方向演进,助力更多金融企业迈向高弹性、高集成、高智能的下一代数据基础设施。
📌 关于白鲸开源 WhaleOps
🔗 白鲸开源:https://www.whaleops.com/index.html
📮 了解更多:service@whaleops.com
版权声明: 本文为 InfoQ 作者【白鲸开源】的原创文章。
原文链接:【http://xie.infoq.cn/article/c4b540e9e8ebcaeae3098ab08】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论