事实表分成三种:事务事实表、周期快照事实表、累计快照事实表 事务事实表 官方定义是:发生在某个时间点上的一个事件。比如以订单为例:下单是一个事实、付款是一个事实、退款是一个事实,所有事实的累计就是事务事实表 周期快照事实表 如果需要对某一天或者某个月的数据进行分析,那么可以使用周期快照事实表,比如: ...
分类:
其他好文 时间:
2017-07-18 01:51:32
阅读次数:
224
《数据仓库》:https://pan.baidu.com/s/1eSms3h4 《数据仓库生命周期工具箱》:https://pan.baidu.com/s/1sli8m4H 2、第三范式建模和维度建模 3、事实表和维度表 4、星型模式和雪花型模式 ...
分类:
其他好文 时间:
2017-07-09 18:26:48
阅读次数:
202
维度建模的数据仓库中,有一个概念叫Bus Architecture,中文一般翻译为“总线架构”。总线架构是Kimball的多维体系结构(MD)中的三个关键性概念之一,另两个是一致性维度(Conformed Dimension)和一致性事实(Conformed Fact)。 ...
分类:
其他好文 时间:
2017-06-29 23:53:12
阅读次数:
506
此文为博主原创题解,转载时请通知博主,并把原文链接放在正文醒目位置。 【题目描述】 a[1]=a[2]=a[3]=1 a[x]=a[x-3]+a[x-1] (x>3) 求a数列的第n项对1000000007(10^9+7)取余的值。 【输入格式】 第一行一个整数T,表示询问个数。 以下T行,每行一个 ...
分类:
其他好文 时间:
2017-06-29 22:36:23
阅读次数:
297
一、 cube构建步骤 1) 加载Hive表 2) 从同步的目录中导入,即将上张图中左侧的数据库中的表导入 3) 上传Hive表 4) 添加流表。 事实表关联其他表创建一个model 1) 填写基本信息 2) 选择事实表 3) 填写关联表(lookup_table)及关联方式 4) 选择维度 5) ...
分类:
其他好文 时间:
2017-06-17 13:12:36
阅读次数:
329
三者功能类似,都可以将表连接起来进行输出。 区别主要体现在性能上。 lookup就是一个表在另一个表中找,处理过程都在内存进行,因此占用内存较多,一般大事实表和小纬表用这种方式关联效率高。 merge和join的处理过程不需用占大量内存。不同在于merge要先把key值排序在做join,因此要求ke ...
分类:
其他好文 时间:
2017-05-23 15:50:09
阅读次数:
204
一、HAWQ参数配置最佳实践(原文地址:http://hawq.incubator.apache.org/docs/userguide/2.1.0.0-incubating/bestpractices...
分类:
其他好文 时间:
2017-04-28 17:16:31
阅读次数:
195
一、HAWQ中的分区表 与大多数关系数据库一样,HAWQ也支持分区表。这里所说的分区表是指HAWQ的内部分区表,外部分区表在后面“外部数据”篇讨论。在数据仓库应用中,事 实表通常有非常多的记录,分区可以将这样的大表在逻辑上分为小的、更易管理的数据片段。HAWQ的优化器支持分区消除以提高查询性能。只要 ...
分类:
其他好文 时间:
2017-03-24 17:25:41
阅读次数:
260
一、HAWQ中的分区表 与大多数关系数据库一样,HAWQ也支持分区表。这里所说的分区表是指HAWQ的内部分区表,外部分区表在后面“外部数据”篇讨论。在数据仓库应用中,事实表通常有非常多的...
分类:
其他好文 时间:
2017-03-15 19:08:34
阅读次数:
278
根据如下四类表数据,创建Model,事实表为酒店信息表,其余三张维度表是城市信息,行政区信息,商圈信息。酒店信息表中有外键分别与地域相关三张表关联DICT_CITYINFODICT_HOTELINFODICT_REGIONINFODICT_ZONEINFO第一步ModelInfoModel的基本信息第二步DataModel选择事实表,依次..
分类:
其他好文 时间:
2017-03-13 22:39:43
阅读次数:
3295