码迷,mamicode.com
首页 > 其他好文 > 详细

ETL基础1(概念)

时间:2016-09-04 12:52:12      阅读:202      评论:0      收藏:0      [点我收藏+]

标签:

抽取(Extract):

一般抽取过程需要连接到不同的数据源,以便为随后的步骤提供数据。这一部分看上去简单而琐碎,实际上它是 ETL 解决方案的成功实施的一个主要障碍。

转换(Transform):

任何对数据的处理过程都是转换。这些处理过程通常包括(但不限于)下面一些操作:
移动数据
根据规则验证数据
数据内容和数据结构的修改
将多个数据源的数据集成
根据处理后的数据计算派生值和聚集值


加载(Load):

将数据加载到目标系统的所有操作。
概念扩展:ELT,EII(Enterprise information integration)/Data federation

架构图:

技术分享

商业ETL

1 Informatica
2 IBM DataStage
3 Microsoft SSIS
4 Oracle ODI

开源ETL

1 Kettle
2 Talend
3 CloverETL
4 Ketl,Octopus …

 

ETL基础1(概念)

标签:

原文地址:http://www.cnblogs.com/kamil/p/5838951.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!