上一篇分享博文《数据仓库专题(3)--分布式数据仓库事实表设计思考》后,陆续有各位兄弟参加大讨论,提出了各种问题,关于分布式环境下,维表和事实表设计,进行了比较深入的探讨,在此汇集整理,分享给大家。希望能有更多人参与尽力啊,共同探索分布式数据仓库数据模型的设计。...
分类:
其他好文 时间:
2015-04-19 21:25:19
阅读次数:
181
最近在设计数据仓库的数据逻辑模型,考虑到海量数据存储在分布式数据仓库中的技术架构模式,需要针对传统的面相关系型数据仓库的数据存储模型进行技术改造。设计出一套真正适合分布式数据仓库的数据存储模型。...
分类:
其他好文 时间:
2015-04-19 21:25:04
阅读次数:
176
分布式数据仓库事实表设计思考续,关于分布式环境下,维表和事实表设计讨论帖:以键代值得争议和探讨
分类:
其他好文 时间:
2015-04-16 19:45:26
阅读次数:
153
事实表记录发生在现实世界中的操作型事件,其所产生的可度数值。事实表的设计完全依赖于物理活动,不受可能产生的最终报表的影响。事实表中,除数字度量外,事实表总是包含外键,用于关联与之相关的维度,也可以包含退化的维度键和日期/时间戳。
分类:
其他好文 时间:
2015-04-14 19:38:52
阅读次数:
129
解决方法:在事实表的来源里选上逻辑级别,然后在结果界面刷新。
分类:
其他好文 时间:
2015-03-18 15:38:57
阅读次数:
139
一个典型的例子是,把逻辑业务比作一个立方体,产品维、时间维、地点维分别作为不同的坐标轴,而坐标轴的交点就是一个具体的事实。也就是说事实表是多个维度表的一个交点。而维度表是分析事实的一个窗口。 首先介绍下数据库结构中的星型结构,该结构在位于结构中心的单个事实数据表中维护数据,其它维度数据存储在维度表中。每个维度表与事实数据表直接相关,且通常通过一个键联接到事实数据表中。星型架构是数据仓库比较流向...
分类:
其他好文 时间:
2015-03-05 17:04:02
阅读次数:
95
今天是农历2014年的最后一个工作日了,在这里提前祝大家新年快乐、羊年大吉!当然本人今天也拿出来点儿真东西,做为献给大家的新年礼物,依次共勉.下文主要讲述的是使用Java代码来完成对cube基于部门维度创建custom view,实现角色级别的权限控制第一部分:通用数据库设计1:事实表(订单分析)-...
分类:
编程语言 时间:
2015-02-13 18:07:27
阅读次数:
384
日期维度 任何一个数据仓库都应该有一个日期维度。 因为很少有不需要通过日期维度看数据的情况存在。 日期维度的好处是,你可以通过他连接各个事实表,然后在报表端传送报表参数的时候, 直接自动过滤日期维度的相关值,而不需要自己写query. 去掉了西班牙语和法语的那些列。 You know that th...
分类:
其他好文 时间:
2015-01-24 17:08:03
阅读次数:
135
基本业务:一个事件发生后,影响到多个国家,这个事件也会被定一个事件类型(这里简化为type1,2,3),处理这个事件花费多长时间。我们的事实表就记录这个事情,相对应的我们设计两个维表,一个是国家,一个是事件类型,我们可以从这两个维度slice数据。 因为受影响的国家是多值的,所以一条fact表中的记...
分类:
其他好文 时间:
2015-01-24 07:52:17
阅读次数:
214
凡是建设数据仓库,一定会提到维度建模方法。这一方法是Kimball最先提出的,其最简单的描述就是,按照事实表、维度表来构建数据仓库、数据集市。在维度建模方法体系中,维度是描述事实的角度,如日期、商品、地址等,事实是要度量的指标,如用户数、销售额等。按照一般书籍的介绍,维度建模还会分为星型模型、雪花模...
分类:
其他好文 时间:
2015-01-20 13:43:28
阅读次数:
156