1.insertInsert时,from子句既能够放在select子句后,也能够放在insert子句前,以下两句是等价的hive> FROM invites a INSERT OVERWRITE TABLE eventsSELECT a.bar, count(*) WHERE a.foo > 0 G...
分类:
其他好文 时间:
2014-10-09 21:51:37
阅读次数:
270
装hive装了1天多时间,总算装好了。下面记录一下安装的步骤。一:安装hive之前,需要安装好hadoop 和mysql.这里就不在赘述了。二:下载hive0.9.0(http://archive.apache.org/dist/hive/hive-0.9.0/),上传到Ubuntu用户目录下。然后...
分类:
数据库 时间:
2014-10-09 14:36:43
阅读次数:
268
随着云计算和hadoop的发展,去IOA随之在各个行业开展起来。去o的过程必然涉及到一些sql用mr或hive改写的过程。本文就是在实际工作中涉及到hive改造oracle存储过程时用hive实现minus函数。...
分类:
数据库 时间:
2014-10-09 03:10:47
阅读次数:
196
今天在用hive进行查询练习,因为采用了条件查询,hive默认会把查询转变成mapreduce的job去执行,结果发现job一直僵在那里不动,找了好久都没发现问题,看hadoop的mast节点日志,也没有问题,最后查看node节点的日志发现了“INFO org.apache.hadoop.ipc.....
分类:
其他好文 时间:
2014-10-09 02:04:37
阅读次数:
813
详细记录基于Hadoop2.5.1的集群的安装过程,集群组件包含:JDK、Hadoop、Hive、ZK、MySql、Sqoop,并记录安装过程中遇到的问题及解决方案。...
分类:
其他好文 时间:
2014-10-08 14:14:35
阅读次数:
373
Hive简介1、hive基本概念hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的Map...
分类:
其他好文 时间:
2014-10-03 12:52:54
阅读次数:
184
Hadoop-1.2.1伪分布下 hive-0.10.0内嵌模式安装1、下载hive-0.10.0 网址是:http://archive.apache.org/dist/hive/hive-0.10.0/ 下载的安装包为:hive-0.10.0.tar.gz 2012-12-18 23:21 35M...
分类:
其他好文 时间:
2014-10-03 09:37:54
阅读次数:
223
bug集锦1. hadoop平台datanode无法启动:原因: 由于多次hdfs namenode -format导致dfs/data/current/version中的cluserID与当前的cluserID不统一,通过查看hadoop/logs中的datanode日志文件查看到此错误。解决方....
分类:
其他好文 时间:
2014-10-02 23:55:33
阅读次数:
205
业务模型: 在关系型数据库中有张很大的表,被设计成奇偶库存储,每个库100张一模一样的表,每张表存储1000W,字段切换到下一个表。现需要同步这个数据到hive中(hdfs),循环抽取这些数据。如果是抽取增量的带上增量字段(每天增量数据存储在哪个表,奇数库还是偶数库是不知道的)。...
分类:
其他好文 时间:
2014-10-01 09:25:40
阅读次数:
367