码迷,mamicode.com
首页 >  
搜索关键字:azkaban    ( 109个结果
分布式工作流任务调度系统Easy Scheduler正式开源
分布式工作流任务调度系统EasyScheduler正式开源1、背景在多位技术小伙伴的努力下,经过近2年的研发迭代、内部业务剥离及重构,也经历一批种子用户试用一段时间后,EasyScheduler终于迎来了第一个正式开源发布版本--1.0.0。相信做过数据处理的伙伴们对开源的调度系统如oozie、azkaban、airflow应该都不陌生,在使用这些调度系统中可能会有这样的体验:比如配置工作流任务不
分类:其他好文   时间:2019-04-09 00:17:06    阅读次数:282
Sqoop
1、sqoop 2、概述: 3、sqoop安装部署 4、sqoop的import导入 5、mysql导入到hive 6、sqoop的export命令 7、常用参数 ...
分类:其他好文   时间:2019-03-10 13:47:56    阅读次数:218
Azkaban
Azkaban安装部署 https://azkaban.github.io/azkaban/docs/2.5/ 生成密钥对和证书Keytool是java数据证书的管理工具,使用户能够管理自己的公/私钥对及相关证书。-keystore 指定密钥库的名称及位置(产生的各类信息将存在.keystore文件 ...
分类:其他好文   时间:2019-03-05 09:44:09    阅读次数:434
开源数据流管道-Luigi vs Azkaban vs Oozie vs Airflow
原文链接:https://www.jianshu.com/p/4ae1faea733b 随着企业的发展,他们的工作流程变得更加复杂,越来越多的有着错综复杂依赖关系的工作流需要增加监控,故障排除。如果没有明确的血缘关系。就可能出现问责问题,对元数据的操作也可能丢失。这就是有向无环图(DAG),数据管道 ...
分类:其他好文   时间:2019-01-28 13:47:50    阅读次数:508
azkaban的部署以及简单使用
1.工作流调度器的介绍(1)为什么要使用工作流调度器???-一个完整的数据分析系统通常都是由大量任务单元组成:shell脚本程序,java程序,mapreduce程序、hive脚本等??-各任务单元之间存在时间先后及前后依赖关系??-为了很好地组织起这样的复杂执行计划,需要一个工作流调度系统来调度执行(2)常见工作流调度器?&e
分类:其他好文   时间:2019-01-17 23:55:27    阅读次数:347
hadoop生态的大体介绍
重点组件:HDFS:Hadoop的分布式文件存储系统MapReduce:Hadoop的分布式程序运算框架,也可以叫做一种编程模型Hive:基于Hadoop的类SQL数据仓库工具HBase:基于Hadoop的列式分布式NoSQL数据库ZooKeeper:分布式协调服务组件Mahout:基于MapReduce/Flink/Spark等分布式运算框架的机器学习算法库Oozie/Azkaban:工作流调度
分类:其他好文   时间:2019-01-11 14:19:16    阅读次数:174
工作流调度系统Azkaban的简介和使用
1 概述 1.1 为什么需要工作流调度系统 l 一个完整的数据分析系统通常都是由大量任务单元组成: shell脚本程序,java程序,mapreduce程序、hive脚本等 l 各任务单元之间存在时间先后及前后依赖关系 l 为了很好地组织起这样的复杂执行计划,需要一个工作流调度系统来调度执行; 例如 ...
分类:其他好文   时间:2018-12-19 15:40:42    阅读次数:170
大数据基础之调度框架
常见调度框架实现方式 开源 Oozie 成熟稳定可靠,可直接用于生产环境 Azkaban 单点、简单粗暴,有两套独立的调度实现,必须二次开发才可用 Airflow 代码以及流程配置都是python 自己封装 基于quartz单机 使用zk来做分布式控制 常用quartz+zk做调度系统 使用db心跳 ...
分类:其他好文   时间:2018-12-12 19:04:14    阅读次数:237
【Azkaban搭建】---Azkaban 3.25.0搭建细则 超实用
一、前述 Azkaban是一个工作流调度工具,因为需要各个任务之间有依赖关系,传统的Crontab 任务已经不能满足 所以需要建立一套工作流引擎。相比Ooize来说,Azkaban的优势是作为一个客户端来提供任务的提交。而Ooize是将任务随机分配到我们的集群环境中。考虑到常用架构,所以我们选择Az ...
分类:其他好文   时间:2018-11-02 19:06:08    阅读次数:237
大数据调度平台 azkaban windows IDEA/eclipse debug 环境搭建
近些日子需要研究大数据调度平台azkaban源码, 发现只有 linux运行的脚本,也没有windows下面的脚本,下面是怎么搭建IEDA /eclipse debug运行环境步骤。其实也挺简单的,我整理了下,方便初学者快速上手调试 ,希望可以帮助到大家。 1. 下载azkaban 源码 ,并按文档 ...
分类:Windows程序   时间:2018-09-21 19:47:48    阅读次数:601
109条   上一页 1 ... 3 4 5 6 7 ... 11 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!