Hive是一个基于hadoop的数据仓库工具。Hive的查询语言是hive ql。一种类似sql的语言。
Hive支持的数据类型有
1整形:
Tinyint 1字节整型
Smallint 2字节整型
Bigint 8字节整型
2.布尔型
Boolean
3浮点型
Float
Double
4字符串类型
String
5.符合类型
...
分类:
其他好文 时间:
2014-07-22 23:03:34
阅读次数:
393
创建表:
hive> CREATE TABLE pokes (foo INT, bar STRING);
Creates a table called pokes with two columns, the first being an integer and the other a string
创建一个新表,结构与其他一样
hive> create table n...
分类:
其他好文 时间:
2014-05-15 07:07:58
阅读次数:
303
1.我使用的Hadoop2.0-cdh4.3.0,对应hive配套版本hive-0.10.0-cdh4.3.0。
2.修改hive/conf下hive-site.xml文件,无则创建hive-site.xml,在底部添加如下内容:
[html] view
plaincopy
xml version="1.0" encoding="UTF-8"...
分类:
其他好文 时间:
2014-05-15 04:05:27
阅读次数:
341
一、 创建表
在官方的wiki里,example是这样的:
Sql代码
CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITION...
分类:
数据库 时间:
2014-05-14 14:50:27
阅读次数:
463
分区概述
为了简化数据库大表的管理,例如在数据仓库中一般都是TB级的数量级.ORACLE8以后推出了分区选项.分区将表分离在若于不同的表空间上,用分而治之的方法来支撑元限膨胀的大表,组大表在物理一级的可管理性.将大表分割成较小的分区可以改善表的维护、备份、恢复、事务及查询性能。分区的优点:1、增强可...
分类:
其他好文 时间:
2014-05-09 19:12:24
阅读次数:
297
原文:SSIS从理论到实战,再到应用 一,是什么(What?)
1.SSIS是Microsoft SQL Server Integration
Services的简称,是生成高性能数据集成解决方案(包括数据仓库的提取、转换和加载 (ETL) 包)的平台.
以上的这段文字来自于百度,脱离这个概念,我一...
分类:
其他好文 时间:
2014-05-09 07:49:45
阅读次数:
308
JDO(Java Data Object )是Java对象持久化的新的规范,也是一个用于存取某种数据仓库中的对象的标准化API。注意JDO是一种规范,而不是一个产品。而DataNucleus正是实现JDO规范的产品之一,JDO实现产品还有FOStore、JPOX等。当然DataNucleus不仅实现了JDO规范,还实现了JPA(java另一持久化规范),也就是说有了DataNucleus,你既可以...
分类:
其他好文 时间:
2014-05-09 01:51:48
阅读次数:
346
数据仓库技术包括数据清理、数据集成和联机分析处理(OLAP)OLAP是一种分析技术,具有汇总,合并和聚集功能,以及从不同的角度观察信息的能力。但,对于深层次的分析,如数据分类,聚类和数据随时间变化的特征,仍然需要其他
分析工具。尽管市场上已有许多“数据挖掘系统”,但是并非所有的 都能进行真正的数据挖...
分类:
其他好文 时间:
2014-05-08 20:18:07
阅读次数:
323
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。
最常用的就是多表关联查询,主要讲解下join、outer join和semi join的具体使用。
join是最简单的关联操作,两边关联只取交集。
outer join分为left outer join、rig...
分类:
其他好文 时间:
2014-05-06 15:01:38
阅读次数:
269
1、商业智能 商业智能的实现有三个层次:数据报表、多维数据分析和数据挖掘。 商业智能项目的实施步骤:
需求分析 数据仓库建模 数据抽取 建立商业智能分析报表 用户培训和数据模拟测试 系统改进和完善商业智能系统应具有的主要功能 数据仓库 数据ETL
数据统计输出(报表) 分析功能 商业智能的软件工具集...
分类:
其他好文 时间:
2014-05-03 22:16:23
阅读次数:
284