码迷,mamicode.com
首页 > 数据库 > 详细

Kettle实现SQL Server数据到GreenPlum的每日同步调度

时间:2017-07-30 22:03:14      阅读:471      评论:0      收藏:0      [点我收藏+]

标签:jmh   pxe   nal   smd   rpd   edm   gil   adf   was   

1.总的调度流程,通过linux下的crontab定时执行一个包含kjb执行信息的shell脚本

技术分享

 

2.XXXX_0_Execute_Judge转换下有两个作业,通过获取每天的同步状态值来判断是否执行同步工作,如果同步状态不满足,会发邮件告知

技术分享

 

3.XXXX_A0_Connect_Next作业下含有四个并行执行的作业,Message_Prepare_Yes作业负责的获取到同步状态OK的Email邮件通知

技术分享

 

技术分享

4.四个并行执行的作业分别负责同步不同的模块数据(整个同步原则是小表直接同步,大表通过BCP导出,映射成GP对应的utf-8的txt外部表)

 

技术分享

技术分享

 

技术分享

技术分享

 

5.在所有的模块成功执行完成后,会发送同步完成的邮件通知

技术分享

 

以上只是记录ETL项目的整理框架流程,整个过程比较复杂的地方在于超过十几个G的大表压缩传送,GBK到UTF-8的转码。

 

Kettle实现SQL Server数据到GreenPlum的每日同步调度

标签:jmh   pxe   nal   smd   rpd   edm   gil   adf   was   

原文地址:http://www.cnblogs.com/binguo2008/p/7260423.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!