flink
57 人感兴趣 · 675 次引用
- 最新
- 推荐
只需 2 小时,变身 Flink 实战派:Flink-Learning 实战营火热报名中
你想知道今天 GitHub 上炙手可热的 TOP 10 项目是什么吗?
美团买菜基于 Flink 的实时数仓建设
美团买菜实时数仓技术负责人严书,在 Flink Forward Asia 2022 实时湖仓专场的分享。
揭秘阿里云 Flink 智能诊断利器——Flink Job Advisor
揭秘阿里云 Flink 智能诊断利器——Flink Job Advisor
Flink 实现高效实时处理百万级数据:实践与优化
在这个数据爆炸的时代,如何快速、高效地处理海量数据一直是大数据从业者面临的难题。Flink,作为一个实时流处理引擎框架,性能卓越、灵活性强、技术趋势良好,正在逐渐成为实时计算领域新宠
活动预告|6 月 15 日 Apache Paimon Meetup,深入解读 Apache Paimon 0.4.0 !
活动预告|6月15 日 Apache Paimon Meetup,深入解读 Apache Paimon 0.4.0 !
揭秘阿里云 Flink 智能诊断利器——Fllink Job Advisor
解决用户在使用Flink全托管产品全生命周期中可能遇到的各种难题,提升用户使用Flink的体验,降低对人工服务的依赖。
深入探究 Flink:实时处理与批量处理的完美结合
每一个生产线都面临着不同的挑战与机遇:数据源不断涌现,数据格式多样、数据额度庞大。实时处理和批量处理对于许多企业都是不可或缺的工具,但它们本身都存在缺陷。然而,随着实时大数据产业不断升级,它们终于找到完美的结合点——Flink
小米基于 Flink 的实时数仓建设实践
本次分享围绕小米在实时数仓方面的探索与实践展开,主要涉及:Flink+Iceberg 实时数仓架构升级,稳定性与实时性优化;基于当前 Flink 实时数仓的不确定性问题,介绍 Merge into 功能和算子级状态清理的解决方案。
基于 Log 的通用增量 Checkpoint
阿里巴巴开发工程师,Apache Flink Contributor 俞航翔,在 Flink Forward Asia 2022 核心技术专场的分享。
Hybrid Shuffle 测试分析和使用建议
本文将基于测试结果详细分析 Hybrid Shuffle 的优势场景,并基于我们的经验给出一些使用建议。
电商行业实践专栏上线|阿里巴巴风控实战如何解决大规模风控的技术难点?
Flink-learning 学训平台第 4 期课程——电商行业实践专栏上线啦!
深入解读 Flink 1.17
摘要:本文整理自阿里云技术专家,Apache Flink PMC Member & Committer、Flink CDC Maintainer 徐榜江(雪尽) 在深入解读 Flink 1.17 的分享。
万字长文详述 ClickHouse 在京喜达实时数据的探索与实践 | 京东云技术团队
在引入ClickHouse过程中经历各种困难,耗费大量精力去探索并一一解决,在这里记录一下希望能够给没有接触过ClickHouse的同学提供一些方向上的指引避免多走弯路,如果文中有错误也希望多包含给出指点,欢迎大家一起讨论ClickHouse相关的话题。
基于 Log 的通用增量 Checkpoint 在美团的进展
美团计算引擎工程师王非凡,在 Flink Forward Asia 2022 核心技术专场的分享。
B 站构建实时数据湖的探索和实践
bilibili 大数据实时团队资深开发工程师周晖栋,在 Flink Forward Asia 2022 实时湖仓专场的分享。
行业实践专栏上线|互娱领域专家解读 Flink 企业应用实践
Flink-learning 学训平台第 3 期课程——互娱行业实践专栏上线啦!
蚂蚁实时低代码研发和流批一体的应用实践
摘要:本文整理自蚂蚁实时数仓架构师马年圣,在 Flink Forward Asia 2022 流批一体专场的分享。
Flink 中的时间及窗口类型
在Flink中定义了3种时间类型:事件时间(Event Time)、处理时间(Processing Time)和摄取时间(Ingestion Time)。
日常节省 30% 计算资源:阿里云实时计算 Flink 自动调优实践
阿里云开发工程师,Apache Flink Contributor 钟旭阳,在 Flink Forward Asia 2022 生产实践的分享。
Flink 数据流元素
数据流元素在Flink中叫作StreamElement,有数据记录StreamRecord、延迟标记Latency Marker、Watermark、流状态标记StreamStatus这4种,分别有各自不同的用途。
Hive SQL on Flink 构建流批一体引擎
阿里巴巴开发工程师罗宇侠&方盛凯,在 Flink Forward Asia 2022 流批一体专场的分享。
Flink 数据流介绍
对Flink这种以流为核心的分布式计算引擎而言,数据流是核心数据抽象,表示一个持续产生的数据流,与Apache Beam中的PCollection的概念类似
Flink 应用开发
Flink应用,也叫作Flink作业、Flink Job。Flink作业包含了两个基本的块:数据流(DataStream)和转换(Transformation)。
Flink 运行架构
Flink集群采用Master-Slave架构,Master的角色是JobManager,负责集群和作业管理,Slave的角色是TaskManager,负责执行计算任务。
巴别时代基于 Apache Paimon 的 Streaming Lakehouse 的探索与实践
本文主要介绍巴别时代基于 Apache Paimon(Incubating) 构建 Streaming Lakehouse 的生产实践经验。