码迷,mamicode.com
首页 > 其他好文 > 详细

Airflow 中文文档:用Celery扩大规模

时间:2018-11-29 20:16:30      阅读:126      评论:0      收藏:0      [点我收藏+]

标签:path   文件   操作   https   undefined   参数   air   工作   应该   

CeleryExecutor是您扩展工人数量的方法之一。 为此,您需要设置Celery后端( RabbitMQ , Redis ,...)并更改airflow.cfg以将执行程序参数指向CeleryExecutor并提供相关的Celery设置。

有关设置Celery代理的更多信息,请参阅有关该主题的详尽Celery文档 。

以下是您的员工的一些必要要求:

  • 需要安装airflow,CLI需要在路径中
  • 整个群集中的气流配置设置应该是同构的
  • 在worker上执行的操作符需要在该上下文中满足其依赖项。 例如,如果您使用HiveOperator ,则需要在该框上安装hive CLI,或者如果您使用MySqlOperator ,则必须以某种方式在PYTHONPATH提供所需的Python库
  • 工作人员需要访问其DAGS_FOLDER ,您需要通过自己的方式同步文件系统。 常见的设置是将DAGS_FOLDER存储在Git存储库中,并使用Chef,Puppet,Ansible或用于配置环境中的计算机的任何内容在计算机之间进行同步。 如果您的所有盒子都有一个共同的挂载点,那么共享您的管道文件也应该可以正常工作

要启动工作人员,您需要设置Airflow并启动worker子命令

airflow worker

阅读全文/改进本文

Airflow 中文文档:用Celery扩大规模

标签:path   文件   操作   https   undefined   参数   air   工作   应该   

原文地址:https://www.cnblogs.com/wizardforcel/p/10039826.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!