码迷,mamicode.com
首页 >  
搜索关键字:hive    ( 5904个结果
hive与hbase整合
配置环境.hadoop2.4hbase0.98.3hive0.13.1(源用的mysql)配置。分2种情况(1.hbase与hive在一台机器上,2.hbase与hive不在同一台机器上)(1)hbase与hive在一台机器上比较简单,只需要在环境变量里把hbase,hive的home配置好即可。当然也可以按照不在一台进行配置。#confighad..
分类:其他好文   时间:2014-08-11 18:14:03    阅读次数:177
如何为SparkSQL添加hive中支持的而SparkSQL暂未支持的命令
以ANALYZE为例描述ANALYZE在Hive中的使用方法详见:https://cwiki.apache.org/confluence/display/Hive/StatsDev#StatsDev-ExistingTablesANALYZE在Hive中使用简单介绍一张表有4个分区:Partitio...
分类:数据库   时间:2014-08-11 14:23:32    阅读次数:428
gzip: stdin: unexpected end of file
gzip: stdin: unexpected end of filetar: Unexpected EOF in architar: Unexpected EOF in archivevetar: Error is not recoverable: exiting now从网上下载了一个tar的文...
分类:其他好文   时间:2014-08-11 11:35:22    阅读次数:320
HIVE RCFile高效存储结构
本文介绍了Facebook公司数据分析系统中的RCFile存储结构,该结构集行存储和列存储的优点于一身,在 MapReduce环境下的大规模数据分析中扮演重要角色。Facebook曾在2010 ICDE(IEEE International Conference on Data Engineerin...
分类:其他好文   时间:2014-08-10 10:18:00    阅读次数:315
基于MySQL元数据的Hive的安装和简单测试
Hive是一种强大的数据仓库查询语言,类似SQL,本文将介绍如何搭建Hive的开发测试环境。...
分类:数据库   时间:2014-08-10 01:50:39    阅读次数:449
Hive基础之Hive体系架构&运行模式&Hive与关系型数据的区别
Hive架构1)用户接口: CLI(hive shell):命令行工具;启动方式:hive 或者 hive --service cli ThriftServer:通过Thrift对外提供服务,默认端口是10000;启动方式:hive --service hiveserver WEBUI(浏览器...
分类:其他好文   时间:2014-08-10 01:27:29    阅读次数:467
Hive基础之Hive是什么以及使用场景
Hive是什么1)Hive 是建立在Hadoop (HDFS/MR)上的用于管理和查询结果化/非结构化的数据仓库;2)一种可以存储、查询和分析存储在Hadoop 中的大规模数据的机制;3)Hive 定义了简单的类SQL 查询语言,称为HQL,它允许熟悉SQL 的用户查询数据;4)允许用Java开发自...
分类:其他好文   时间:2014-08-09 23:10:49    阅读次数:288
Hive基础之Hive环境搭建
Hive默认元数据信息存储在Derby里,Derby内置的关系型数据库、单Session的(只支持单客户端连接,两个客户端连接过去会报错);Hive支持将元数据存储在关系型数据库中,比如:Mysql/Oracle;本案例采用的是将hive的元数据存储在MySQL中,故需要先安装MySQL数据库,使用...
分类:其他好文   时间:2014-08-09 23:10:09    阅读次数:337
hive0.13.1安装-mysql server作为hive的metastore
hive0.13.1在hadoop2.4.1伪分布式部署上安装过程环境:redhat enterprice 6.5 +hadoop2.4.1+hive0.13.1+mysql单节点伪分布式部署相关网址:hive官网安装指导:https://cwiki.apache.org/confluence/di...
分类:数据库   时间:2014-08-09 21:21:09    阅读次数:357
Impala与Hive的比較
1. Impala架构 Impala是Cloudera在受到Google的Dremel启示下开发的实时交互SQL大数据查询工具,Impala没有再使用缓慢的Hive+MapReduce批处理,而是通过使用与商用并行关系数据库中类似的分布式查询引擎(由Query Planner、Query Coord...
分类:其他好文   时间:2014-08-09 15:39:48    阅读次数:451
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!