1、星型模型的组成一个星型模型对应一个分析主题,它由一个事实表和一组维表组成。其中事实表是星型模型的核心,由分析变量和分析维度代理键组成,分析变量存放分析事实数 据,分析维度代理键用于连接维表。维表是星型模型的外围,存放分析维度数据,由维的代理键、维的层次属性、维的描述信息组成。2、星型维度模型设计...
分类:
其他好文 时间:
2015-05-19 12:25:31
阅读次数:
109
MicrosoftSQLServer2005AnalysisServices(SSAS)为商业智能应用程序提供联机分析处理(OLAP)和数据挖掘功能。MicrosoftSQLServer2005IntegrationServices(SSIS)是生成高性能数据集成解决方案(包括数据仓库的提取、转换和...
分类:
数据库 时间:
2015-05-18 15:59:40
阅读次数:
168
首先介绍一下Shark的概念
Shark简单的说就是Spark上的Hive,其底层依赖于Hive引擎的
但是在Spark平台上,Shark的解析速度是Hive的几多倍
它就是Hive在Spark上的体现,并且是升级版,一个强大的数据仓库,并且是兼容Hive语法的下面给出一张来自网上的Shark构架图从图上可以看出,Spark的最底层大部分还是基于HDFS的,Shark中的数据信息等也是对应着H...
分类:
数据库 时间:
2015-05-15 09:11:25
阅读次数:
314
数据库:
派生属性:其值可以从一个相关属性和属性集的值派生得到的属性。
多值属性:指同时由多个值表示的属性。
数据挖掘:应用一系列技术从大型数据库或数据仓库中提取人们感兴趣的信息和知识。1,决策树。2,神经网络。3,遗传算法。4,关联规则挖掘算法。
数据挖掘的分析方法分4种:关联分析、序列模式分析、分类分析、聚类分析。
命名冲突:相同意义的属性,在不同的分E-R图上有不同的命名,或名称相...
分类:
数据库 时间:
2015-05-14 23:52:39
阅读次数:
247
数据仓库建模过程中,针对事务型事实表设计,经常会遇到维度属性选择的问题,比如客户维度,在操作型系统中,为了跟踪客户状态的变化,往往会附加客户记录的四个属性: 1.add time:添加时间; 2.add user:添加用户; 3.mod time:修改时间; 4.mod ...
分类:
其他好文 时间:
2015-05-13 18:28:02
阅读次数:
84
正本溯源,要想搞清楚这个问题,还是要回到维度的定义上来。维度是用来对数据进行分类的结构和人们观察业务情况的角度.关于维度的定义至今未看到统一的行业标准。在此选取Kimball的说法:“维度提供围绕某一业务过程所涉及的‘谁、什么、何处、何时、为什么、如何’等背景。维度表包含BI应用所需要的用于过滤及分类事实的描述性属性。...
分类:
其他好文 时间:
2015-05-13 16:46:12
阅读次数:
81
[Author]: kwu --关于HIVE数据仓库的基本操作...
分类:
其他好文 时间:
2015-05-13 13:02:42
阅读次数:
187
下面内容摘自互联网并作了整理。名词:BI(Business Intelligence):商业智能,DW(Data Warehouse):数据仓库,详见正文Q1部分。OLTP(On-Line Transaction Processing):联机事务处理也称为面向交易的处理系统,其基本特征是顾客的原始数...
分类:
其他好文 时间:
2015-05-12 13:03:15
阅读次数:
157