* Oozie框架基础 官方文档地址:http://oozie.apache.org/docs/4.0.0/DG_QuickStart.html 除Oozie之外,类似的框架还有: ** Zeus:https://github.com/michael8335/zeus2 ** Azkaban:htt ...
分类:
其他好文 时间:
2018-01-12 22:38:25
阅读次数:
614
1:修改本地linux时区 查看时区 - 号代表西 + 号 代表东 北京时间是东八区 设置时区的配置文件所在位置 选择以亚洲的上海 的时区为基址 删除本地配置文件 创建一个硬连接 时区变成东八区了 设置时间 2:设置oozie的时区 在oozie-site.xml修改 oozie默认使用UTC 等同 ...
分类:
其他好文 时间:
2017-12-20 22:11:36
阅读次数:
428
准备工作 拷贝原来的模板 配置文件修改 workflow.xml : job.properties : 把自己写的MapReduce的jar 放上去 把改好的文件放入到hdfs 准备测试数据 在hdfs创建输入目录 并把刚创建的文件上传 运行oozie 查看输出结果 原文件 统计后的文件 http: ...
分类:
其他好文 时间:
2017-12-15 16:53:20
阅读次数:
244
根据一些公开资料整理,也许有失偏颇,仅供参考: 1.第一代 Hadoop 承载的 MapReduce 2.第二代 支持 DAG(有向无环图) 的框架: Tez 、 Oozie,主要还是还是批处理任务 3.第三代 Job 内部的 DAG(有向无环图) 支持(不跨越 Job),以及强调的实时计算:Spa ...
分类:
其他好文 时间:
2017-11-13 00:15:18
阅读次数:
242
安装oozie经历了好长的时间,先是源码包,但是放弃了。。。然后就是安装的这个CDH版本的,弄了好久,经常报各种错误。最后整理出来这篇。先对文件进行下载:这里使用的是CDH版本的,免编译,看着编译的过程就够了。下载地址:http://archive.cloudera.com/cdh5/cdh/5/oozie-4.1..
分类:
其他好文 时间:
2017-10-13 14:59:10
阅读次数:
1282
本文地址:【置顶】历史书单--程序员的文娱情怀 快速索引 文档连接:Hive文档 Hdfs官方 Spark官方 Oozie官方 CDH文档 IDEA文档 About云中文论坛 JavaPlatformSDK Java8懒妹表达式 公开课:机器学习Stanford课程 书单:2015豆瓣书单 豆瓣千人 ...
分类:
其他好文 时间:
2017-09-29 10:07:06
阅读次数:
191
Oozie概述: Oozie是一个基于Hadoop工作流引擎,也可以称为调度器,它以xml的形式写调度流程,可以调度mr,pig,hive,shell,jar,spark等等。在实际工作中,遇到对数据进行一连串的操作的时候很实用,不需要自己写一些处理代码了,只需要定义好各个action,然后把他们串 ...
分类:
其他好文 时间:
2017-09-14 14:55:25
阅读次数:
224
bundle job可以绑定多个coordinator. 语法: 官网给出的例子(绑定两个coordinator): 我们工作时的(简略版)bundle.xml: coordinator.xml: workflow.xml: job.properties ...
分类:
其他好文 时间:
2017-09-04 11:04:11
阅读次数:
368
coordinator application: coordinator application是在满足一组条件时触发动作(通常是工作流作业)的程序。条件可以是时间频率、新数据集实例或其他外部事件。 coordinator application的类型:同步:它的协调器动作是在指定的时间间隔创建的, ...
分类:
其他好文 时间:
2017-08-31 12:52:31
阅读次数:
259
CDH5.7卸载1.记录用户数据目录2.关闭所有服务2.1在CM中,选择某个集群,然后停止集群。2.2逐个关闭CDH中的服务3.删除parcels4.删除集群5.卸载Cloudera manager server5.1 如果是用Cloudera-manager-installer.bin 文件安装5... ...
分类:
其他好文 时间:
2017-08-30 22:28:28
阅读次数:
342