美文网首页程序员ApacheCN
Airflow 中文文档:常见问题

Airflow 中文文档:常见问题

作者: 布客飞龙 | 来源:发表于2018-11-29 18:05 被阅读6次

为什么我的任务没有安排好?

您的任务可能无法安排的原因有很多。 以下是一些常见原因:

  • 您的脚本是否“编译”,Airflow引擎是否可以解析它并找到您的DAG对象。 要对此进行测试,您可以运行airflow list_dags并确认您的DAG显示在列表中。 您还可以运行airflow list_tasks foo_dag_id --tree并确认您的任务按预期显示在列表中。 如果您使用CeleryExecutor,您可能需要确认这既适用于调度程序运行的位置,也适用于工作程序运行的位置。
  • 包含DAG的文件是否在内容的某处包含字符串“airflow”和“DAG”? 在搜索DAG目录时,Airflow忽略不包含“airflow”和“DAG”的文件,以防止DagBag解析导入与用户的DAG并置的所有python文件。
  • 你的start_date设置正确吗? 在传递start_date + scheduler_interval之后,Airflow调度程序会立即触发任务。
  • 您的schedule_interval设置正确吗? 默认schedule_interval是一天( datetime.timedelta(1) )。 您必须直接为实例化的DAG对象指定不同的schedule_interval ,而不是default_param ,因为任务实例不会覆盖其父DAG的schedule_interval
  • 您的start_date超出了在UI中可以看到的位置吗? 如果将start_date设置为3个月之前的某个时间,您将无法在UI的主视图中看到它,但您应该能够在Menu -> Browse ->Task Instances看到它。
  • 是否满足任务的依赖性。 直接位于任务上游的任务实例需要处于success状态。 此外,如果已设置depends_on_past=True ,则上一个任务实例需要成功(除非它是该任务的第一次运行)。 此外,如果wait_for_downstream=True ,请确保您了解其含义。 您可以从Task Instance Details页面查看如何设置这些属性。
  • 您需要创建并激活DagRuns吗? DagRun表示整个DAG的特定执行,并具有状态(运行,成功,失败,......)。 调度程序在向前移动时创建新的DagRun,但永远不会及时创建新的DagRun。 调度程序仅评估running DagRuns以查看它可以触发的任务实例。 请注意,清除任务实例(从UI或CLI)确实将DagRun的状态设置为恢复运行。 您可以通过单击DAG的计划标记来批量查看DagRuns列表并更改状态。
  • 是否达到了DAG的concurrency参数? concurrency定义了允许DAG running任务实例的数量,超过这一点,事物就会排队。
  • 是否达到了DAG的max_active_runs参数? max_active_runs定义允许的DAG running并发实例的数量。

您可能还想阅读文档的“计划程序”部分,并确保完全了解其进度。

如何根据其他任务的失败触发任务?

查看文档“概念Trigger Rule部分中的“ Trigger Rule部分

安装airflow [crypto]后,为什么连接密码仍未在元数据db中加密?

查看文档“配置”部分中的“ Connections部分

阅读全文/改进本文

相关文章

  • Airflow 中文文档:常见问题

    为什么我的任务没有安排好? 您的任务可能无法安排的原因有很多。 以下是一些常见原因: 您的脚本是否“编译”,Air...

  • Airflow 中文文档:安装

    获得气流 安装最新稳定版Airflow的最简单方法是使用pip : 您还可以安装Airflow,支持s3或post...

  • Airflow 中文文档:教程

    本教程将向您介绍一些基本的Airflow概念,对象及其在编写第一个管道时的用法。 示例管道定义 以下是基本管道定义...

  • Airflow 中文文档:插件

    Airflow内置了一个简单的插件管理器,可以通过简单地删除$AIRFLOW_HOME/plugins文件夹中的文...

  • Airflow 中文文档:安全

    默认情况下,所有门都打开。 限制对Web应用程序的访问的一种简单方法是在网络级别或使用SSH隧道执行此操作。 但是...

  • Airflow 中文文档:时区

    默认情况下启用对时区的支持。 Airflow在内部和数据库中以UTC格式存储日期时间信息。 它允许您使用时区相关的...

  • Airflow 中文文档:Lineage

    注意 Lineage 支持是非常实验性的,可能会发生变化。 Airflow可以帮助跟踪数据的来源,发生的事情以及数...

  • Airflow 中文文档:项目

    历史 Airflow于2014年10月由Airbnb的Maxime Beauchemin开始。 它是第一次提交的开...

  • Airflow 中文文档:概念

    Airflow Platform是用于描述,执行和监控工作流的工具。 核心理念 DAG的 在Airflow中, D...

  • Airflow 中文文档:用upstart运行Airflow

    Airflow可以与基于upstart的系统集成。 Upstart会在系统启动时自动启动/etc/init具有相应...

网友评论

    本文标题:Airflow 中文文档:常见问题

    本文链接:https://www.haomeiwen.com/subject/xdofcqtx.html