写点什么

airflow

0 人感兴趣 · 12 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/5c/5c90adc867eeda617ac0e3024a746607.webp?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

ByteHouse+Apache Airflow:高效简化数据管理流程

Apache Airflow与ByteHouse相结合,为管理和执行数据流程提供了强大而高效的解决方案。本文突出了使用Apache Airflow与ByteHouse的主要优势和特点,展示如何简化数据工作流程并推动业务成功。

https://static001.geekbang.org/infoq/43/436e1dc4aa9ccbcd206cf3299e42577d.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

白鲸开源发布迁移工具 Airphin 并开源,2 步迁移 Airflow 至 Dolphinscheduler

白鲸开源正式发布调度系统迁移工具 Airphin,并宣布将其开源。借助 Airphin,用户可 2 步将调度系统从 Airflow 迁移至 Apache DolphinScheduler,为有调度系统迁移需要的用户带来极大便利。

https://static001.geekbang.org/infoq/38/380738e90c425b58d6525bf357d4beef.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大数据调度平台 Airflow(七):Airflow 分布式集群搭建原因及其他扩展

用户头像
Lansonli
2022-09-24

在稳定性要求较高的场景中,例如:金融交易系统,airflow一般采用集群、高可用方式搭建部署,airflow对应的进程分布在多个节点上运行,形成Airflow集群、高可用部署,架构图如下:

https://static001.geekbang.org/infoq/92/9271633c62d77832b207481f03a6b35e.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大数据调度平台 Airflow(六):Airflow Operators 及案例

用户头像
Lansonli
2022-09-23

Airflow中最重要的还是各种Operator,其允许生成特定类型的任务,这个任务在实例化时称为DAG中的任务节点,所有的Operator均派生自BaseOparator,并且继承了许多属性和方法。关于BaseOperator的参数可以参照:

https://static001.geekbang.org/infoq/80/802b00208ae820d3580476da7061c101.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大数据调度平台 Airflow(五):Airflow 使用

用户头像
Lansonli
2022-09-22

上文说到使用Airflow进行任务调度大体步骤如下:

https://static001.geekbang.org/infoq/77/779fce0fbd614dbd2a32fa89ed16b54e.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大数据调度平台 Airflow(四):Airflow WebUI 操作介绍

用户头像
Lansonli
2022-09-21

DAG有对应的id,其id全局唯一,DAG是airflow的核心概念,任务装载到DAG中,封装成任务依赖链条,DAG决定这些任务的执行规则。

https://static001.geekbang.org/infoq/e8/e8a7e9b3bbdf2e2b4ab7ce4668413784.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大数据调度平台 Airflow(三):Airflow 单机搭建

用户头像
Lansonli
2022-09-20

Airflow是基于Python的,就是Python中的一个包。安装要求Python3.6版本之上,Metadata DataBase支持PostgreSQL9.6+,MySQL5.7+,SQLLite3.15.0+。

https://static001.geekbang.org/infoq/cd/cdd44ee1e08e1d5cf88b7263400d8685.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大数据调度平台 Airflow(二):Airflow 架构及原理

用户头像
Lansonli
2022-09-19

Airflow我们可以构建Workflow工作流,工作流使用DAG有向无环图来表示,DAG指定了任务之间的关系,如下图:

解读分布式调度平台 Airflow 在华为云 MRS 中的实践

Airflow是一个使用Python语言编写的分布式调度平台,通过DAG(Directed acyclic graph 有向无环图)来管理任务。

https://static001.geekbang.org/infoq/30/302af929f117ed838d436eec370bcf04.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

SmartNews:基于 Flink 加速 Hive 日表生产的实践

用户头像
Apache Flink
2021-08-25

将 Flink 无缝地集成到以 Airflow 和 Hive 为主的批处理系统的技术挑战和应对方案。

https://static001.geekbang.org/infoq/1a/1ade4bb8582c34fb9a26d4ef885df1c6.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

你不可不知的任务调度神器 -AirFlow

用户头像
王知无
2021-01-17

Airflow 是一个编排、调度和监控workflow的平台,由Airbnb开源,现在在Apache Software Foundation 孵化。AirFlow 将workflow编排为tasks组成的DAGs,调度器在一组workers上按照指定的依赖关系执行tasks。

airflow_airflow技术文章_InfoQ写作社区