写点什么

Apache SeaTunnel MCP Server:让 AI 成为你的 ETL 助手

  • 2025-04-02
    广东
  • 本文字数:1856 字

    阅读完需:约 6 分钟

Apache SeaTunnel MCP Server,可以将 SeaTunnel 的接口文档提供给 Cursor 等支持 AI 编程的 IDE,或其他支持 MCP 的 AI 工具。



MCP Server(Model Context Protocol Server) 是一种基于 MCP 协议的服务器,旨在为大型语言模型(LLM)提供与外部数据源和工具的无缝集成。它通过标准化 AI 系统与数据源的交互方式,帮助模型获取更丰富的上下文信息,从而生成更准确、更相关的响应。‌


SeaTunnel MCP Server 是连接 AI 编程工具与 SeaTunnel 的智能桥梁,有了 SeaTunnel MCP Server,开发者就可以通过 AI 助手完成以下工作:根据跟用户交互实现 RESTful API V2 的接口调用,至于通过这个接口文档数据能让 AI 干什么更多更强大的活,请发挥你和你们团队的想象力😜。

举个栗子🙋‍♀️🌰
  • ⚡ 一键提交/监控数据作业

  • 🔍 智能解析运行日志

  • 📊 自动生成运维报告

  • 🤖 根据自然语言生成配置文件

🚀 五分钟极速体验

<iframe src="//player.bilibili.com/player.html?isOutside=true&aid=114254569014821&bvid=BV1vjZCYPEtZ&cid=29157952350&p=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true"></iframe>

🎯 如何使用

完成相关配置后,Apache SeaTunnel MCP Server 会自动获取 2.3.9 接口文档的数据并缓存在本地,AI 助手可以通过 MCP 读取接口文档数据。


你只要告诉 AI 你想要做什么即可,示例:


  • 查看当前 SeaTunnel 连接 URL

  • 更新 URL 为 http://www.sjjc.seatunnel.dsj.com

  • 帮我提交个作业,配置如下:格式是 hocon


env {  job.mode = "batch"} source {  Jdbc {        url = "jdbc:hive2://***:10000/default"        user = "hive"        password = "******"        driver = "org.apache.hive.jdbc.HiveDriver"        connection_check_timeout_sec = 100        query = "select * from table1 limit 100"    }}
transform {}
sink { Jdbc { url = "jdbc:mysql://***:23306/?rewriteBatchedStatements=true" driver = "com.mysql.cj.jdbc.Driver" user = "root" password = "root" database = "test" table = "table1" # primary_keys = ["key1", "key2", ...] schema_save_mode = "CREATE_SCHEMA_WHEN_NOT_EXIST" data_save_mode="DROP_DATA" generate_sink_sql=true }}
复制代码


  • 帮我查一下 957461773944946690 的运行情况,注意这里的 957461773944946690 是上一步提交作业随机生成的 jobId

  • 帮我查一下正在运行的作业有哪些?

  • 帮我查一下 FINSHED 的作业有哪些

  • 查看集群的运行情况

  • 帮我返回系统系统监控信息

  • 帮我把 957461773944946690 作业停掉

🚀 如何配置

前置条件

1.安装 Python 环境(版本号 >= 3.9,推荐最新的 LTS 版本)


2.安装 Apache SeaTunnel (版本号>=2.3.9)


任意一个支持 MCP 的 IDE:


  • Cursor

  • VS Code + Cline 插件


安装:


# 下载源码git clone https://github.com/ocean-zhc/seatunnel-mcp.git# 进入目录(比如我的下载目录:/Users/ocean/Downloads/MCP/seatunnel-mcp)cd seatunnel-mcp# 安装pip install -e .
复制代码


配置:


这里的SEATUNNEL_API_URL是你部署好的UI地址,后面不要带 /


{    "mcpServers": {        "seatunnel": {            "command": "python",            "args": [                "-m",                "src.seatunnel_mcp"            ],            "cwd": "/Users/ocean/Downloads/MCP/seatunnel-mcp",            "env": {                "SEATUNNEL_API_URL": "http://www.sjjc.seatunnel.dsj.com"            }        }    }}
复制代码


配置完成之后,如下图:


<img width="619" alt="Image" src="https://github.com/user-attachments/assets/297bee27-f946-470f-8945-8d57648b003a" />

❓帮助与支持

可前往issue进行提问:


Support MCP:https://github.com/apache/seatunnel/issues/9047


同时我们也成立了专项交流群,感兴趣的同学可以自行添加seatunnel1小助手加入!

Apache SeaTunnel

Apache SeaTunnel 是一个云原生的高性能海量数据集成工具。北京时间 2023 年 6 月 1 日,全球最大的开源软件基金会 ApacheSoftware Foundation 正式宣布 Apache SeaTunnel 毕业成为 Apache 顶级项目。目前,SeaTunnel 在 GitHub 上 Star 数量已达 8k+,社区达到 6000+人规模。SeaTunnel 支持在云数据库、本地数据源、SaaS、大模型等 170 多种数据源之间进行数据实时和批量同步,支持 CDC、DDL 变更、整库同步等功能,更是可以和大模型打通,让大模型链接企业内部的数据。

用户头像

还未添加个人签名 2022-03-07 加入

Apache SeaTunnel(Incubating) 是一个分布式、高性能、易扩展、用于海量数据(离线&实时)同步和转化的数据集成平台。

评论

发布
暂无评论
Apache SeaTunnel MCP Server:让AI成为你的ETL助手_Apache SeaTunnel_InfoQ写作社区