码迷,mamicode.com
首页 > 其他好文 > 详细

数据仓库与数据挖掘(二)

时间:2018-01-14 22:51:22      阅读:191      评论:0      收藏:0      [点我收藏+]

标签:三种模式   过程   结构   不同   实体关系图   简单   合并   方式   gpo   

1、简述数据仓库的设计步骤。

数据仓库规划(用户业务目标、仓库目标)和需求分析、建模、物理模型设计、部署、维护。

 

2、简述星型模式和雪花模式的区别。

一个事实、一组维表

一个事实、维表接维表

 

3、数据仓库三种模式之间的关系。

星型、雪花、星座

 

4、在设计数据仓库时,为什么确定事实表的粒度非常重要?

事实与粒度相匹配。

 

5、以下关于数据粒度的叙述中哪些是错误。

(1)粒度是指数据仓库小数据单元的详细程度和级别。

(2)数据越详细,粒度就越小,抽象级别也就越高。

(3)数据综合度越高,粒度就越大,抽象级别也就越高。

(4)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量。

 

6、以下关于数据仓库开发特点的叙述中哪些是错误的。

(1)数据仓库开发要从数据出发。

业务需求

(2)数据仓库使用的需求在开发出来后才会明确。

先明确,再开发。设计时要能够应对未来的变化。

(3)数据仓库开发一个不断循环的过程。

(4)数据仓库中数据的分析和处理十分灵活,没有固定的开发模式。

7、以下关于数据仓库设计的说法中哪些是正确的。

(1)数据仓库项目的需求很难把握,所以不可能从用户的需求出发来进行数据仓库的设计,只能从数据出发进行设计。

(2)在进行数据仓库主题数据模型设计时,应该按部门业务应用的方式来设计数据模型。

(3)在进行数据仓库主题数据模型设计时要强调数据的集成性。

(4)在进行数据仓库概念模型设计时,需要设计实体关系图,给出数据表的划分,并给出每个属性的定义域。

8、维表中维有哪些类型?

结构维、信息维、分区维、分类维、退化维、一致维、父子维

 

9、在数据仓库的物理模型设计中,为什么要考虑维的概念分层?

多级汇总、深入洞察、不同用户不同维、灵活

10、在数据仓库的物理模型设计中,合并表组织策略有哪些好处?

节省I/O开销

 

思考:

1、源变化。

急:先处理、再分责

 

2、bottom-up/top-down

top-down:技术成熟、业务过程理解透彻。规范化程度高,最小化数据冗余与不一致性。便于全局。

周期长、见效慢;风险高。

bottom-up:见效快,投资少,灵活;由于部门需求简单,容易实现。

数据逐步清洗提炼。

数据仓库与数据挖掘(二)

标签:三种模式   过程   结构   不同   实体关系图   简单   合并   方式   gpo   

原文地址:https://www.cnblogs.com/moqingtong/p/8284293.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!