码迷,mamicode.com
首页 >  
搜索关键字:数据仓库工具    ( 118个结果
HADOOP生态圈以及各组成部分的简介
重点组件:HDFS:分布式文件系统MAPREDUCE:分布式运算程序开发框架Hive:基于大数据技术(文件系统+运算框架)的SQL数据仓库工具Hbase:基于Hadoop的分布式海量数据库ZOOKEEPER:分布式协调服务基础组件Mahout:基于mapreduce/Spark/flink等分布式运算框架的机器学习算法库Ooz..
分类:其他好文   时间:2017-07-26 21:53:45    阅读次数:180
《数据仓库工具箱》——建模四步骤
Kimball建模方法的精髓,就是简单、使用,建模这四步骤是它的核心部分。用术语表达是:始终一致的四步设计维度模型。 一、选择业务过程 业务过程是由组织完成的一系列微观活动,例如:完成下单、完成支付、发放代金券、上线产品等等。充分理解它们,有助于辨别组织中的不同业务过程,它一般具有这些特性: 用行为 ...
分类:其他好文   时间:2017-07-23 12:37:46    阅读次数:159
Hive
Hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 1.1为什么使用Hive 为什么要使用Hive 操作接口采用类SQL语法,提供快速开发的能力。 避免了去写MapReduce,减少开发人员的学习成本。扩展功能很方便。 1.2 ...
分类:其他好文   时间:2017-07-21 22:01:40    阅读次数:143
hive介绍
我最近研究了hive的相关技术,有点心得,这里和大家分享下。 首先我们要知道hive到底是做什么的。下面这几段文字很好的描述了hive的特性: 1.hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapRedu ...
分类:其他好文   时间:2017-07-20 11:38:12    阅读次数:160
《数据仓库工具箱》——事实表
事实表分成三种:事务事实表、周期快照事实表、累计快照事实表 事务事实表 官方定义是:发生在某个时间点上的一个事件。比如以订单为例:下单是一个事实、付款是一个事实、退款是一个事实,所有事实的累计就是事务事实表 周期快照事实表 如果需要对某一天或者某个月的数据进行分析,那么可以使用周期快照事实表,比如: ...
分类:其他好文   时间:2017-07-18 01:51:32    阅读次数:224
Hive
Hive Day01 Hive是由Facebook开源,构建于hadoop之上的数据仓库工具,将结构化的数据映射成一张表格,提供了类SQL查询语句,底层可以转化为Mapreduce去执行。 一、Hive体系 Hive是构建于hadoop之上的数据仓库工具,将结构化的数据映射成一张表格,提供了类SQL ...
分类:其他好文   时间:2017-07-05 20:08:48    阅读次数:349
《数据仓库工具箱》——如何做好数据仓库
最近打算阅读一下数据仓库相关的书籍,百度了一下,有两本必读书《数据仓库工具箱》和《数据仓库》。简单介绍一下,《数据仓库》这本书更像是一本教材,里面的内容很经典;《数据仓库工具箱》看书名是一本单纯的工具书,其实里面都是实战。两本书各有千秋,我决定主要阅读《数据仓库工具箱》,今天分享第一章的内容,以后会 ...
分类:其他好文   时间:2017-07-03 23:47:45    阅读次数:256
基于MySQL元数据的Hive的安装和简单測试
引言: Hive是一种强大的数据仓库查询语言,类似SQL,本文将介绍怎样搭建Hive的开发測试环境。 1. 什么是Hive? hive是基于Hadoop的一个数据仓库工具,能够将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,能够将sql语句转换为MapReduce任务进行执行。 其 ...
分类:数据库   时间:2017-06-17 10:11:24    阅读次数:214
hadoop基础知识学习
hadoop家族产品 1)Apache Hadoop:是Apache开源组织的一个分布式计算开源框架,提供了一个分布式文件系统子项目(HDFS)和支持MapReduce分布式计算的软件框架。 2)Apache Hive:是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射成一张数据库表, ...
分类:其他好文   时间:2017-06-16 16:40:19    阅读次数:119
Hive 基础入门
Hive的官方网站: https://hive.apache.org/ Hive简介: Hive 是基于Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射成一张表,并提供类SQL查询功能。 Hive在企业中作为一种工作,可以很容易的对数据进行ETL。 Hive可以对各种各样的数据进行一种结 ...
分类:其他好文   时间:2017-06-10 19:28:00    阅读次数:122
118条   上一页 1 ... 5 6 7 8 9 ... 12 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!