标签:
一般抽取过程需要连接到不同的数据源,以便为随后的步骤提供数据。这一部分看上去简单而琐碎,实际上它是 ETL 解决方案的成功实施的一个主要障碍。
任何对数据的处理过程都是转换。这些处理过程通常包括(但不限于)下面一些操作:
移动数据
根据规则验证数据
数据内容和数据结构的修改
将多个数据源的数据集成
根据处理后的数据计算派生值和聚集值
将数据加载到目标系统的所有操作。
概念扩展:ELT,EII(Enterprise information integration)/Data federation
架构图:
商业ETL
1 Informatica 2 IBM DataStage 3 Microsoft SSIS 4 Oracle ODI
开源ETL
1 Kettle 2 Talend 3 CloverETL 4 Ketl,Octopus …
标签:
原文地址:http://www.cnblogs.com/kamil/p/5838951.html