ETL是什么?为什么要使用ETL?KETTLE是什么?为什么要学KETTLE? ETL是数据的抽取清洗转换加载的过程,是数据进入数据仓库进行大数据分析的载入过程,目前流行的数据进入仓库的过程有两种形式,一种是进入数据库后再进行清洗和转换,另外一条路线是首先进行清洗转换再进入数据库,我们的ETL属于后 ...
分类:
其他好文 时间:
2016-04-12 07:19:16
阅读次数:
1190
53亿美元,为什么微软、Salesforce.com也会垂涎Informatica?对于很多人来说,Informatica这个名字会比较陌生,而且念起来可能有点不太顺口。不过,对于做数据集成、数据治理项目的人来说,Informatica是再熟悉不过了。记者曾经因为其他原因采访过几个国内的证券公司,他们使用..
分类:
其他好文 时间:
2015-08-13 10:08:08
阅读次数:
158
使用Redis实现高并发分布式序列号生成服务序列号的构成为建立良好的数据治理方案,作数据掌握、分析、统计、商业智能等用途,业务数据的编码制定通常都会遵循一定的规则,一般来讲,都会有自己的编码规则和自增序列构成。比如我们常见的身份证号、银行卡号、社保电脑号等等。以某公司产品标识码(代表该产品的唯一编码...
分类:
其他好文 时间:
2015-06-02 23:15:29
阅读次数:
386
从广义上来讲,数据标准化的过程可以看作是业务系统内部或业务系统之间,乃至整个数据治理系统中的一个“语言”统一的过程。
只有语言统一,才能让同一业务系统或者不同业务系统之间有了对话、调用、通信的可能,从而保证使用的都是特定的某一个方言。
同样,数据标准化的过程反映程序及系统设计或架构级别时,就可以看作连接程序、机器、用户的一个枢纽,通过标准化让程序、机器、用户都明白某一个词素的确切含义,如果引入...
分类:
其他好文 时间:
2015-04-26 09:24:09
阅读次数:
84
通用性优先使用国际通用单词和用语优先使用客户自身业务中常用的惯用语优先使用客户自身定义且国内惯用的单词或用语使用税务、法律、IT等行业的专业用语考虑与外部机构的相互运行,最大限度地保持通用性实用性对实际的现行系统用语进行标准化,而不是理论上的标准化避免出现难以理解或产生歧义的用语从用语中能够直观地识...
分类:
其他好文 时间:
2015-03-21 15:28:48
阅读次数:
116
元数据管理到底有多重要?它和主数据管理、数据治理之间到底是怎样的关系?本文将讨论这些问题。没有合适的元数据,大数据主数据管理就会失语。没有元数据,数据治理就没有语料。David Marco在他的《元数据仓储的构建与管理》一书中,对元数据给出了这样的定义:元数据是“所有系统、文档和流程中包含的所有数据...
分类:
其他好文 时间:
2015-03-16 20:47:25
阅读次数:
628
信息架构: 成本与架构度量 大数据对信息架构的影响 大数据架构: Oracle的大数据架构逻辑视图: 大数据开发流程 大数据的角色与功能 数据治理 案例:保险 大数据关联与分析 关联与分析 概念视图 数据流 希望您对大数据平台有帮助。 企业应用之性能实时度量系统演变 云计算参考架构几例 智能移动导游...
分类:
其他好文 时间:
2015-02-20 11:57:15
阅读次数:
473