Apache StreamPark 毕业前最后一个版本发布
近日 Apache StreamPark(Incubating) PMC 正式发布了 Apache StreamPark 2.1.4 版本,从 2024 开年以来,社区就在积极准备新版本,为的是让大家在新年伊始就可以用上稳定的版本,助力业务起飞,我们在稳定性的打磨上足够有耐心,这是个诚意满满的版本。在本次发布中,支持了最新的 Apache Flink 1.19,简化了项目的配置,Flink on Kubernetes 方面的能力做了充分验证,修复了一些高危安全漏洞。2.1.4 版本是目前推荐的稳定版本,建议所有用户升级到这个版本。
Github: https://github.com/apache/streampark
官 网: https://streampark.apache.org
欢迎 使用、关注、star、fork
新特性解读
1 支持 Apache Flink 1.19
作为流处理开发管理框架,Apache StreamPark 在对 Apache Flink 的支持上,一如既往地走在前列。得益于 Apache StreamPark 良好的架构设计,使得在 StreamPark 中支持一个新版本的 Flink 非常容易,因此我们率先支持了 Flink 1.19[1]。在使用上非常的简单,用户只需要添加一个 Flink 1.19 的环境即可为作业自由地选择 Flink 版本。并且 Apache StreamPark 适配了更多发行版的 Flink,如 CDH 版本的 Flink、华为云、腾讯云 Flink 等。
StreamPark 支持 Flink 多版本
2 增强部署 Flink on Kubernetes 稳定性
本次特别加强了 Flink on Kubernetes 的可用性和稳定性,修复了 Kubernetes Session 集群停止和状态获取相关的 Bug。简化了 on Kubernetes 模式下参数指定:在 Flink on Kubernetes Application 模式下的几个必要的参数如:serviceAccount,在早期的版本中没有直观的体现出来,需要用户通过 -D <arg> 动态属性 的方式指定,本次直观的将这些参数放到页面中,方便用户设置。
本次发布,在部署 Flink on Kubernetes 方面进行了充分的验证,可用性和稳定性大大增强,感谢参与验证的企业用户。下面是 Apache StreamPark 部署 Flink on Kubernetes 的操作演示:
Flink on K8s Application 上手教程
Flink on K8s Session 上手教程
3 简化平台配置
本次简化了平台的配置文件,在之前的版本中,平台有多个配置文件:application.yml、kerberos.yml... 等,给用户的使用上带来了心智负担,并且在核心配置 application.yml 中,存在大量无需用户关注的系统配置,这给用户的使用带来了干扰,本次将这些配置文件统进行简化,只将需要用户关注的配置项提取到配置文件 config.yaml 中。
考虑到配置文件的兼容性,如果把之前老版本的配置文件放到 conf 下,则会优先加载老版本的配置文件,新的配置 config.yaml 不会生效,这里强烈建议使用新的配置文件,在下个版本中,历史配置文件将不再兼容。
历史配置:
本次简化后的配置文件:
4. 其他改进和更新
修复安全漏洞:CVE-2024-29070、CVE-2024-29120、CVE-2024-29178、CVE-2024-29737、CVE-2024-34457。
修复 Flink on YARN 作业失败后被重复启动多次的 Bug。
修复 MySQL 低版本执行初始化 SQL 存在语法不兼容的 Bug。
修复 Flink on Kubernetes Application 模式作业一直在初始状态的 Bug。
修复 Flink on Kubernetes Application 模式作业已失败,但 Pod 仍然存活的 Bug。
修复用户的作业中存在 System.exit,导致 Apache StreamPark 平台退出的 Bug。
安全性原因,调整 swagger API 范围,仅保留开放 API 部分。
新增项目同时构建的最大并行限制。
Release Note
本次 Apache StreamPark 2.1.4 版本的完整 Release Note 请访问:https://streampark.apache.org/download/release-note/2.1.4
感谢贡献者
StreamPark 开源社区的发展,离不开广大用户群体的积极反馈和宣传布道,更离不开贡献者们的无私贡献,感谢对此版本做出贡献的每一位贡献者。
Mrart、296431555、GOODBOY008、lvshaokang、wangsizhu0504、zhilinli123、Kick156、DimitriMok、ihadoop、zhangxiangyang、gwy1995、dsanww、531651225、zzzk1、wolfboys
别感谢本次的 Release Manager @吕少康[2],吕老师在发版过程中积极地跟踪问题和推进进度,出色地完成了此次发版工作。感谢吕老师为社区做出的贡献,也欢迎其他 PPMC member 和 Committer 在后续的发版中担任 Release Manager,帮助社区更快捷、高质量地完成发版。
什么是 StreamPark
Apache StreamPark 是一个流处理应用程序开发管理框架。旨在轻松构建和管理流处理应用程序,提供使用 Apache Flink 和 Apache Spark 编写流处理应用程序的开发框架和一站式流计算平台,核心能力包括但不限于应用开发、调试、交互查询、部署、运维、实时数仓等。目前已有腾讯、百度、联通、天翼云、自如、马蜂窝、同程数科、长安汽车、天眼查等众多公司在生产环境使用、并且获得了多项业内荣誉,是近年来成长较快的开源项目。
加入我们
Apache StreamPark 加入 ASF 孵化器快 2 年,社区一直以来都以用心做好一个项目为原则,高度关注项目质量和用户的落地使用,努力建设发展社区,认真学习和遵循「The Apache Way」,目前项目趋于成熟,已临近毕业。诚挚欢迎更多的贡献者参与到社区建设中来,和我们一道携手共建,共同见证项目的毕业,可以扫描下面的二维码加入社区讨论群。
💻 项目地址:https://github.com/apache/streampark
🧐 提交问题和建议:https://github.com/apache/streampark/issues
🥁 贡献代码:https://github.com/apache/streampark/pulls
📮 Proposal:https://cwiki.apache.org/confluence/display/INCUBATOR/StreamPark+Proposal
📧 订阅社区开发邮件列表:dev@streampark.apache.org [3]
💁♀️社区沟通:
参考资料
[1] https://nightlies.apache.org/flink/flink-docs-release-1.18/release-notes/flink-1.19
[2] https://github.com/lvshaokang
[3] mailto:dev@streampark.apache.org 祝大家安装、升级顺利~~
版权声明: 本文为 InfoQ 作者【ApacheStreamPark】的原创文章。
原文链接:【http://xie.infoq.cn/article/f8061107c6d23eb1462d88b5d】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论