码迷,mamicode.com
首页 > 其他好文 > 详细

ODI基于源表时间戳字段获取增量数据

时间:2018-06-03 14:25:22      阅读:240      评论:0      收藏:0      [点我收藏+]

标签:声明   col   tco   idt   记录   gen   str   href   最大值   

实现目标:通过ODI获取一个没有时间戳的子表(qb_bw)的增量数据,而主表(qb_tb)有一个rksj入库时间,且主表和子表之间通过ID关联。目标表名是qb_bw1.

设计原理:通过在ODImapping中关联主表和子表,然后在主表的rksj上设置时间过滤,最后将子表的字段映射到目标表中。在此设计中,需要有一个变量,此变量在第一次运行时,使用一个初始值,这样第一次运行会获取此初始值后的所有源数据到目标表,然后根据目标表的rksj更新此变量值,从而得到目标表上最大的时间戳,再基于此时间点去获取源表的记录,从而实现每次运行都可以得到新增的数据。

 

创建变量

新建一个变量保存目标表入库时间的最大值。

技术分享图片

基于文本类型定义变量。

技术分享图片

使用SQL获取目标表时间字段的最大值。

技术分享图片

 

创建mapping

主表的数据基于时间字段过滤,再跟子表关联后加载子表的数据到目标表。

技术分享图片

主表的过滤条件设置

 

技术分享图片

主表和子表的关联条件设置

技术分享图片

 

目标表上新增的入库时间字段,从源端主表获取。

技术分享图片

 

以上映射建立完成之后,可以试运行,确保逻辑是正确的,理论上会基于变量的初始值获取源端的数据加载到目标表。即获取rksj>’2018-05-11’的所有数据加载到目标表。

创建程序包

再建立相关的数据处理流程,即循环获取增量。新建一个程序包

技术分享图片

拖拉刚才创建的变量两次,以及刚才的mapping.

技术分享图片

 

第一个变量上设置为声明变量

技术分享图片

第二个变量为刷新变量

技术分享图片

以上程序包已经可以手工执行,每次执行获取相应的增量数据到目标表。

定时调度

保存程序包,并生成场景。

技术分享图片

在生成的场景上,新建一个调度(前提是后台的agent在正常运行)

技术分享图片

设置场景开始运行的时间

技术分享图片

 

设置场景循环的间隔

 

技术分享图片

 

agent配置处,更新调度信息。

技术分享图片

 

现在即可在查看日志处,看到指定间隔的时间之后,有该程序包处理的日志,以及每次运行后获取的增量记录数等信息。

ODI基于源表时间戳字段获取增量数据

标签:声明   col   tco   idt   记录   gen   str   href   最大值   

原文地址:https://www.cnblogs.com/margiex/p/9128777.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!