标签:
ODS和DW
根据Bill.Inmon的定义,“数据仓库是面向主题的、集成的、稳定的、随时间变化的,主要用于决策支持的数据库系统” ;
ODS (Operational Data Store)操作型数据存储,ODS具备数据仓库的部分特征和OLTP系统的部分特征,它是“集成的、当前或接近当前的、不断变化的”数据,一般不保留数据的变动轨迹,是数据仓库体系结构中的一个可选部分;
ODS |
DW |
主要是和源系统表结构相同,表结构随着源系统变化 |
面向主题的表模型,模型相对稳定 |
一般只保留最新数据或较短时间段的数据 |
历史数据,记录轨迹 |
追求时间窗口短,满足报表数据的实效性 |
批处理时间窗口较长 |
Update、Insert、Merge操作 |
主要是Insert操作 |
ODS行业建设:
实施方案 |
特点 |
风险 |
数据仓库(DW) |
一般包含一个数据准备层,先进行源数据采集和清洗;有稳定成熟的模型; |
投入大、风险高 |
操作型数据存储(ODS) |
主要是快速采集源数据;一般也会采用DW的一些技术;可以部分保留较少天数的历史数据,不能满足企业的中远期决策需求;缺点是数没有稳定的数据层; |
投资小、但涉及技术较多 |
ODS+DW |
一般ODS用于报表数据源,同时为DW提供数据;DW作决策支持,提供历史数据; |
一般需要分步实施,降低风险 |
常用术语:
ETL(Extract Transform Load) 数据抽取转换加载软件 |
例如IBM Datastage、Informatic PowerCenter |
DM(Data Mart)数据集市 |
数据集市也可叫做“小数据仓库”。如果说数据仓库是建立在企业级的数据模型之上的话。那么数据集市就是企业级数据仓库的一个子集,他主要面向部门级业务,并且只面向某个特定的主题。数据集市可以在一定程度上解决访问数据仓库的瓶颈 |
Cognos |
报表开发展现工具 |
Cube |
数据立方体,Cognos基于文件的多维数据组织,用于多维分析 |
主数据 |
主要的业务数据,例如客户信息、卡、帐户 |
Metadata元数据 |
数据的数据,包括数据源元数据、ETL规则元数据、OD元数据、报表元数据、接口文件元数据、业务规则元数据等 |
ODS优缺点:
主要优点:
缺点和不足:
标签:
原文地址:http://www.cnblogs.com/theseven/p/4836241.html