码迷,mamicode.com
首页 >  
搜索关键字:ETL    ( 2204个结果
ETL的考虑
感谢shwenwen转自http://www.itpub.net/thread-355437-1-2.html09: 09 ETL的考虑做数据仓库系统,ETL是关键的一环。说大了,ETL是数据整合解决方案,说小了,就是倒数据的工具。回忆一下工作这么些年来,处理数据迁移、转换的工作倒还真的不少。但是那...
分类:其他好文   时间:2014-12-24 11:30:35    阅读次数:218
ETL 解析
extract-transform-load (ETL)Everyone understands the three letters: You get the data out of its original source location (E), you do something to it (...
分类:其他好文   时间:2014-12-23 19:22:05    阅读次数:127
kettle 4.4源码分析之Transformation
1.1. 相关类和接口 1.1.1. JobEntryTrans 实现了JobEntryInterface的execute()方法,被job执行。由JobEntryTrans实例化Trans,并执行。 1.1.2. TransGraph 当点击trans面板的run时,由TransGraph实例化Trans,并执行。 Trans主要成员有: private TransMeta tran...
分类:其他好文   时间:2014-12-23 12:33:50    阅读次数:325
ETL利器Kettle实战应用解析系列一【Kettle使用介绍】
本系列文章主要索引如下:一、ETL利器Kettle实战应用解析系列一【Kettle使用介绍】二、ETL利器Kettle实战应用解析系列二 【应用场景和实战DEMO下载】三、ETL利器Kettle实战应用解析系列三 【ETL后台进程执行配置方式】本文主要阅读目录如下:1、Kettle概念2、下载和部署...
分类:其他好文   时间:2014-12-23 12:19:52    阅读次数:199
kettle(PDI)简介
最近项目需要,开始接触kettle。 Kettle 的主作者是 Matt ,他在 2003 年就开始了这个项目,在 PDI 的代码里就可以看到最早的日期大概在2003年4月。 从版本2.2开始, Kettle 项目进入了开源领域,并遵守 LGPL 协议。 在 2006年 Kettle 加入了开源的 BI 组织 Pentaho, 正式命名为PDI, 加入Pentaho 后Kettle 的发展越来...
分类:其他好文   时间:2014-12-19 12:18:26    阅读次数:203
用友财务总账(GL)模块的BI数据ETL分析
/* Sql Server2012使用作业设置定时任务,来保证一天执行一次 */ /* 一定要注意temp1表里一定要保证要有记录,否则以temp1 来 left join就出现为空的情况。 */ /* Step 1: 把所有的数据库列表都插入到BI数据库的DBLIST表里 */ USE BI; /* drop table BI.DBO.TEMP1; drop table...
分类:其他好文   时间:2014-12-17 22:40:53    阅读次数:272
ETL Pentaho代码学习笔记
1、通过设置KETTLE_HOME环境变量可以让.kettle不需要在user.home下 2、默认kettle_home 为User.home,如果要自定义需要设置环境变量KETTLE_HOME 3、在.kettle目录下可放置以下文件或目录: ? ?? ? ? ? ?文...
分类:其他好文   时间:2014-12-17 19:06:14    阅读次数:250
可爱的猪——Pig
pig 提供了一个基于hadoop并行执行数据流处理的引擎,以Pig Latin来描述数据流,相当于一个有向无环图(DAG),节点代表处理数据的操作符,节点间的向量代表数据流。pig 提供了类SQL的标准操作,比直接写mapreduce代码更容易维护,主要用于ETL,原生数据研究和迭代处理。pig 什么数据都吃,也能在非hadoop上并行运算,容易控制和修改,性能较快。用户提交hadoop任务的那...
分类:其他好文   时间:2014-12-13 17:58:05    阅读次数:182
kettle入门(三) 之kettle连接hadoop&hdfs图文详解
最详细的kettle连接hadoop&hdfs图文教程...
分类:其他好文   时间:2014-12-11 10:26:52    阅读次数:426
etl工作中的设计问题
http://blog.csdn.net/lili72 背景1 : 随着接入数据和处理数据的增加,生产脚本也越来越多,脚本由于前期的开发人员没有做到规范管理,导致脚本很乱。 解决方案:    1) 在lunix上规范目录,按平台,业务模块分目录存放。    2) 做好版本管理,提交到生产的脚本必须要commit到svn服务器。    3) lunix上的目录是反应到svn的目录映射。...
分类:其他好文   时间:2014-12-10 22:51:42    阅读次数:208
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!