数据仓库搭建——Inmon与Kimball

时间：2017-06-27 14:51:17 阅读：158 评论：0 收藏：0 [点我收藏+]

一、简介

搞数据仓库这么久，实践中发现首先搭建数据集市，还是清洗数据之后，直接进入数据立方体（形成维度表和实施表）形成核心数据仓库层，是个选择题...

随后发现这其实涉及到了数据仓库的历史问题，是采用Inmon建模还是采用Kimball建模？甚至有人称之为数据仓库界的宗教之争。下面我说一下自己的理解：

2000年5月，W.H.Inmon在DM Review杂志上发表一篇文章，正是揭示了他的企业信息化工厂的特点。下图是我理解的企业信息化工厂架构图：

技术分享

上面是一个旅游B2C数据仓库的案例，左边是业务原数据。这些数据经过ETL加工，注入到企业数据仓库中。

我理解，Kimball与Inmon的主要区别就是数据集市前置，这样在数据仓库迭代开发过程中更接近需求，也会提升敏捷性。通常，Kimball都是以最终任务为导向。

首先，在得到数据后需要先做数据的探索，深入理解业务逻辑与数据表的关系。

然后，在明确数据依赖后，按照目标需求，直接生成数据集市表。

最后，（数据集市层）拆分出事实表和维度表

结果，数据集市一方面可以直接向BI环节输出数据，另一方面也可以向数据仓库层输出数据，方便后续的多维分析。如下图：

技术分享

他们之间的区别用这个图表体现非常合适：

https://segmentfault.com/a/1190000006255954

http://blog.csdn.net/paicMis/article/details/53236869

原文地址：http://www.cnblogs.com/liqiu/p/7081823.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行