1、Hive 1.1在hadoop生态圈中属于数据仓库的角色。他能够管理hadoop中的数据,同时可以查询hadoop中的数据。 本质上讲,hive是一个SQL解析引擎。Hive可以把SQL查询转换为MapReduce中的job来运行。 hive有一套映射工具,可以把SQL转换为MapReduce中...
分类:
其他好文 时间:
2015-02-28 16:05:57
阅读次数:
195
在报表项目中,报表源数据常常会来自于多种异构数据源。例如:关系型数据库(oracle、db2、mysql),nosql数据库(mongodb),http数据源,hadoop(hive、hdfs)甚至是excel或者文本文件。通常的做法是采用ETL工具,将这些数据源都同步到数据仓库中。但是这样做的问题在于:1、..
分类:
其他好文 时间:
2015-02-27 18:49:13
阅读次数:
245
近年来,南京地税通过探索大数据应用下的服务新模式,积极拓展服务新领域,建立起以客户为中心的精准服务体系。据了解,南京地税的精准服务体系主要依托其强大的数据仓库平台,通过充分应用大数据挖掘、分析等现代化的信息技术,将数据以不落地的方式直接推送办税前台、官方微信、12366系统等服务渠道,实现精准服务。...
分类:
其他好文 时间:
2015-02-26 16:21:55
阅读次数:
146
用hbase做数据库,但因为hbase没有类sql查询方式,所以操作和计算数据很不方便,于是整合hive,让hive支撑在hbase数据库层面 的 hql查询.hive也即 做数据仓库1. 基于Hadoop+Hive架构对海量数据进行查询:http://blog.csdn.net/kunshan_s...
分类:
其他好文 时间:
2015-02-19 10:44:36
阅读次数:
220
调查显示,到2020年,全球数据使用量预计将暴增44倍,达到35.2ZB。大数据颠覆了传统的IT世界,挑战着企业的存储架构、数据中心的基础设施,数据仓库、数据挖掘、商业智能、云计算等各个应用环节。工业革命以后,书籍等以文字为载体的知识大约每十年可以翻一番;1970年以后,知识大约每三年就可以翻一番;...
分类:
其他好文 时间:
2015-02-18 12:59:07
阅读次数:
155
利用mysql常用日期函数生成时间维度表,效率最高,最简单,无需其他的一些工具支持。...
分类:
数据库 时间:
2015-02-17 16:33:17
阅读次数:
186
在报表项目中,客户越来越关注源数据的实时性,希望看到最新发生的数据在报表中体现出来。但是,传统的报表工具+数据仓库+ETL方式很难做到这一点,往往是只能看到昨天、上周甚至是上个月的情况,也就是T+1、T+7、T+30统称T+n报表。很难实现T+0报表,也就是能体现实时信息的报表。
分析其原因在于:1、如果报表的历史数据和最新数据都从客户的生产系统读取,虽然可以实现T+0报表,但...
分类:
其他好文 时间:
2015-02-17 10:23:11
阅读次数:
197
一:Hive基本介绍
Hive是建立在Hadoop上的数据仓库基础构架,它提供了一系列工具可以用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模的数据机制。
使用语言:QL语言(类SQL查询语言)。能处理内建的mapper和reducer无法完成的复杂分析工作。
1.Hive是SQL解析引擎,它将SQL语句转译成M/R Job然后再Hadoop执行。
2...
分类:
其他好文 时间:
2015-02-16 11:45:31
阅读次数:
1005
一、概述 PivotGridControl是DevExpress组件中的一个重要控件,在数据多维分析方面具有强大的功能,它不仅可以分析数据库中的数据,而且还能够做联机分析处理(OLAP),并且支持多种数据仓库。前面的文章中介绍了如何用PivotGridControl制作交叉表部件,在智能窗体上展示交...
分类:
其他好文 时间:
2015-02-15 13:32:02
阅读次数:
1662
前言:有关数据仓库的研究,并不仅仅停留在理论上。目前,几种主要的RDBMS产品,如Oracle、SQL Server、Informix和 Sybase等,都可以为用户提供数据仓库项目的开发工具;而一些通用的应用程序开发平台,如Delphi等,也能对数据仓库项目的开发提供有效的支持。我们将使用Microsoft SQL Server 2005提供的数据仓库工具SSAS对数据仓库中的数据进行OLAP(联...
分类:
数据库 时间:
2015-02-15 01:04:56
阅读次数:
225