Hadoop的数据管理,主要包括Hadoop的分布式文件系统HDFS、分布式数据库HBase和数据仓库工具Hive的数据管理。
分类:
其他好文 时间:
2014-07-22 22:54:13
阅读次数:
243
内容简介:1.位图索引1.1位图索引使用注意事项;1.2使用位图索引;1.3位图索引对DML操作的影响;2.位图连接索引2.1明确需求后使用位图索引;2.1创建位图连接索引的注意事项:1.位图索引:1.1位图索引使用注意事项:? 一般适用于低基数列;?适合数据仓库;?对于启用位图索引的表,应尽量减少...
分类:
数据库 时间:
2014-07-22 09:10:33
阅读次数:
360
1、筹划数据库,确定数据库的使用目的,根据这一目的来觉得数据库的类型。是选择联机事务处理系统(OLTP)还是决策支持系统(DSS数据 仓库系统)。这两类系统是完全不同的系统,其调优策略是背道而驰的。在选择数据库的类型是最好不要选择通用型的general purpose,因为这种类型的数据库在管理和维...
分类:
数据库 时间:
2014-07-19 21:01:35
阅读次数:
316
在进行ETL数据抽取的时候,往往会对数据进行条件拆分,比如当[工资]》5000时,才进入数据仓库,否则输出到Excel。类似这种需求。今天就来讲解一下条件拆分控件的使用。达到的目的就是把[OrderStatusCode]等于99的输出到数据仓库,不等于99的输出到Excel中。第一步:准备原始数据,...
分类:
其他好文 时间:
2014-07-16 00:40:19
阅读次数:
360
需求:数据仓库中所有表的定义结构保存到新的文件中,保存后类似下面数据,重复的数据只保留7月份即可****************ods_log_info*****************lid string uid string mb_uid string operation string modu...
分类:
编程语言 时间:
2014-07-14 14:29:01
阅读次数:
285
ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程)作为BI/DW(Business Intelligence)的核心和灵魂,能够按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。如果说数据仓库的模型设计是一座大厦的设计蓝图,数据是砖瓦的话,那么ETL就是建设大厦的过程。在整个项目中最难部分是用户需求...
分类:
其他好文 时间:
2014-07-12 21:46:17
阅读次数:
221
NCR Teradata银行业数据仓库解决方案-------------------------------------------------------------------------------- 随着金融自由化、资本市场国际化的步伐加快,国内金融企业面临着前所未有的竞争压力。除市场结构、...
分类:
其他好文 时间:
2014-07-10 16:58:14
阅读次数:
206
简介:本文的主要内容不是介绍现有的比较流行的主要行业的一些数据模型,而是将笔者在数据仓库建设项目中的一些经验,在这里分享给大家。希望帮助大家在数据仓库项目建设中总结出一套能够合乎目前业界规范的,满足大部分行业数据仓库建设标准的一种方法。所谓水无定势,兵无常法。不同的行业,有不同行业的特点,因此,从业...
分类:
其他好文 时间:
2014-07-10 16:54:29
阅读次数:
269
免责声明: 本文转自网络文章,转载此文章仅为个人收藏,分享知识,如有侵权,请联系博主进行删除。 原文作者:知识点滴 原文地址: 维度表, 事实表, 数据仓库, BI... 以前一直对维度表, 事实表, 数据分析, BI等概念等有一些模糊. 这几天的学习终于让这些有了一些眉目了: 维度表示你要对数据进...
分类:
其他好文 时间:
2014-07-09 23:07:28
阅读次数:
282
一、开启权限
目前hive支持简单的权限管理,默认情况下是不开启,这样所有的用户都具有相同的权限,同时也是超级管理员,也就对hive中的所有表都有查看和改动的权利,这样是不符合一般数据仓库的安全原则的。Hive可以是基于元数据的权限管理,也可以基于文件存储级别的权限管理,此次以介绍MetaData权限管理为主。通过以下配置开启Hive身份认证功能进行权限检查:
hive.se...
分类:
其他好文 时间:
2014-07-08 14:06:26
阅读次数:
192