在报表项目中,客户越来越关注源数据的实时性,希望看到最新发生的数据在报表中体现出来。但是,传统的报表工具+数据仓库+ETL方式很难做到这一点,往往是只能看到昨天、上周甚至是上个月的情况,也就是T+1、T+7、T+30统称T+n报表。很难实现T+0报表,也就是能体现实时信息的报表..
分类:
其他好文 时间:
2015-03-04 19:27:13
阅读次数:
160
背景:1.SVN服务器:VisualSVN-Server-2.5.5;2.SVN客户端:TortoiseSVN-1.7.6.22632-x64-svn-1.7.4.msi;3.在SVN服务器上,新建一个数据仓库aaa,用户ABC拥有读写权限。现象:1.在checkout数据仓库aaa时,出现如下错误...
分类:
其他好文 时间:
2015-03-04 14:38:52
阅读次数:
190
什么是数据仓库主题自从学习数据仓库以来,对数据仓库“面向主题”的概念始终比较模糊,理解不够深刻、透彻。昨天晚上翻开课本温习一下,仍然不能领悟其本质思想、很是困惑,后来从网上找了一些资料,细细着磨一下。1.主题的概念主题(Subject)是在较高层次上将企业信息系统中的数据进行综合、归类和分析利用的一...
分类:
其他好文 时间:
2015-03-04 14:30:40
阅读次数:
253
什么是数据仓库?数据仓库是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(NonVolatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理:①数据仓库用于支持决策,面向分析型数据处理,它不同于企业现..
分类:
其他好文 时间:
2015-03-03 18:59:35
阅读次数:
208
什么是数据仓库?数据仓库是一个面向主题的( Subject Oriented) 、集成的( Integrate) 、相对稳定的(NonVolatile) 、反映历史变化( Time Variant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理:①数据仓库用于支持决策,面向...
分类:
其他好文 时间:
2015-03-03 13:25:35
阅读次数:
142
本文转载自:http://blog.csdn.net/haojun186/article/details/79775651.HIVE结构Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoo...
分类:
其他好文 时间:
2015-03-02 18:11:16
阅读次数:
387
1.1 为什么进行数据挖掘数据挖掘把大型数据集转化成知识。数据仓库是一种多个异构数据源在单个站点以统一的模式组织的存储,以支持管理决策。联机分析处理(OLAP)是一种分析技术,具有汇总、合并和聚集以及从不同的角度观察信息的能力。(注:与联机事务处理OLTP不同)1.2 什么是数据挖掘数据挖掘是从大量...
分类:
其他好文 时间:
2015-03-02 12:45:29
阅读次数:
170
导读:Apache Hive是一个构建于Hadoop(分布式系统基础架构)顶层的数据仓库,Apache HBase是运行于HDFS顶层的NoSQL(=Not Only SQL,泛指非关系型的数据库)数据库系统。区别于Hive,HBase具备随即读写功能,是一种面向列的数据库。对于刚接触大数据的用户来...
分类:
其他好文 时间:
2015-03-01 13:01:55
阅读次数:
223
数据挖掘系列文章跟我一起数据挖掘(1)——建立数据仓库的意义跟我一起数据挖掘(2)——挖掘模式跟我一起数据挖掘(3)——谈谈支持度和置信度跟我一起数据挖掘(4)——数据挖掘涉及的技术跟我一起数据挖掘(5)——数据类型跟我一起数据挖掘(6)——显示图表跟我一起数据挖掘(7)——矩阵跟我一起数据挖掘(8...
分类:
其他好文 时间:
2015-02-28 18:29:25
阅读次数:
194