最新 最热

apache-airflow

Apache Airflow® 是一个开源平台,用于开发、安排和监控面向批处理的工作流。Airflow 的可扩展 Python 框架使您能够构建与几乎任何技术连接的工作流。Web 界面有助于管理工作流程的状态。Airflow 可以通过多种方式进...

2024-10-03
1

Airflow 任务并发使用总结

之前有简单介绍过 Airflow ,参考Airflow 使用简单总结、Airflow 使用总结(二)、Airflow 使用——Variables, 最近一直在用 Airflow 处理调度任务涉及到了并发问题,任务的 graph 关系如下,图中每个方框是一个任务 task,标 N...

2024-01-25
1

简化数据管道:将 Kafka 与 Airflow 集成

Apache Kafka 是一个分布式事件流平台,凭借可扩展性、耐用性和容错能力而蓬勃发展。它充当消息代理,支持实时发布和订阅记录流。其架构可确保高吞吐量、低延迟的数据传输,使其成为跨多个应用程序处理大量实时数据的首选...

2023-12-26
1

用 Kafka、Spark、Airflow 和 Docker 构建数据流管道指南

在本指南中,我们将深入探讨构建强大的数据管道,用 Kafka 进行数据流处理、Spark 进行处理、Airflow 进行编排、Docker 进行容器化、S3 进行存储,Python 作为主要脚本语言。...

2023-11-27
1

SP Module 2 – Acoustics of Consonants and Vowels

The waveform and a definition of the fundamental period.

2022-11-10
1

AIRFLow_overflow百度百科

Airflow 是一个 Airbnb 的 Workflow 开源项目,使用Python编写实现的任务管理、调度、监控工作流平台。Airflow 是基于DAG(有向无环图)的任务管理系统,可以简单理解为是高级版的crontab,但是它解决了crontab无法解决的任...

2022-11-01
1

大数据调度平台Airflow(八):Airflow分布式集群搭建及测试

默认Airflow安装在$ANCONDA_HOME/envs/python37/lib/python3.7/site-packages/airflow目录下。配置了AIRFLOW_HOME,Airflow安装后文件存储目录在AIRFLOW_HOME目录下。可以每台节点查看安装Airflow版本信息:...

2022-09-25
1

大数据调度平台Airflow(六):Airflow Operators及案例

Airflow中最重要的还是各种Operator,其允许生成特定类型的任务,这个任务在实例化时称为DAG中的任务节点,所有的Operator均派生自BaseOparator,并且继承了许多属性和方法。关于BaseOperator的参数可以参照:...

2022-09-21
1

大数据调度平台Airflow(二):Airflow架构及原理

Airflow我们可以构建Workflow工作流,工作流使用DAG有向无环图来表示,DAG指定了任务之间的关系,如下图:

2022-09-18
1