码迷,mamicode.com
首页 >  
搜索关键字:hive shims类    ( 5904个结果
Hive学习(五)hive日志
日志记录了程序运行的过程,是一种查找问题的利器。 Hive中的日志分为两种 1. 系统日志,记录了hive的运行情况,错误状况。 2. Job 日志,记录了Hive 中job的执行的历史过程。 系统日志存储在什么地方呢 ? 在hive/conf/ hive-log4j.properties 文件中记录了Hive日志的存储情况, 默认的存储情况: hive.root.log...
分类:其他好文   时间:2014-10-22 18:15:13    阅读次数:141
hive:子查询
hive本身支持的子查询非常有限,Hive不支持where子句中的子查询,只允许子查询在from中出现错误写法:insert into table branch_atmzc_sumSelect XT_OP_TRL, SA_TX_DT,"取款-存款",b.cr_tx_amt- a.cr_tx_amt....
分类:其他好文   时间:2014-10-22 10:55:14    阅读次数:1598
sparkSQL1.1入门之四:深入了解sparkSQL运行计划
前面两章花了不少篇幅介绍了SparkSQL的运行过程,很多读者还是觉得其中的概念很抽象,比如Unresolved LogicPlan、LogicPlan、PhysicalPlan是长得什么样子,没点印象,只知道名词,感觉很缥缈。本章就着重介绍一个工具hive/console,来加深读者对sparkSQL的运行计划的理解。 1:hive/console安装       spa...
分类:数据库   时间:2014-10-22 10:11:17    阅读次数:430
sqoop的安装与使用
Sqoop即 SQL to Hadoop ,是一款方便的在传统型数据库与Hadoop之间进行数据迁移的工具,充分利用MapReduce并行特点以批处理的方式加快数据传输,发展至今主要演化了二大版本,Sqoop1和Sqoop2。 Sqoop工具是hadoop下连接关系型数据库和Hadoop的桥梁,支持关系型数据库和hive、hdfs,hbase之间数据的相互导入,可以使用全表导入和增量导入。 那么为什么选择Sqoop呢? 高效可控的利用资源,任务并行度,超时时间。 数据类型映射与转化,可自动进行,用户...
分类:其他好文   时间:2014-10-21 19:42:33    阅读次数:651
hive 事故报告
今天早上来了,发现我们所有服务器上的hive来客户端都不可用了。最后发现 mysql数据库,不知道为什么多了一条数据: ? mysql> select * from version;? +--------+----------------+------------------+ | VER...
分类:其他好文   时间:2014-10-17 15:47:47    阅读次数:214
Hive配置
Hive配置(只需要主机上配置)MySQL数据库安装元数据迁移到mysql主机上先安装mysql,用于存放hadoop元数据Mysql驱动下载一个数据包mysql-connector-java-5.1.18-bin.jar,放到hive的lib目录下,创建mysql用户并赋权创建hive数据库mysql>createdatabasehive;mysql>showdatab..
分类:其他好文   时间:2014-10-16 21:35:33    阅读次数:227
Hadoop日志分析系统启动脚本
Hadoop日志分析系统启动脚本 #!/bin/bash #Flume日志数据的根目录 root_path=/flume #Mapreduce处理后的数据目录 process_path=/process #hive分区时间 partition=`date "+%Y-%m-%d"` #获取前一小时的时间:/YYYY-MM-DD/HH file_path=`date -d "1 hour ...
分类:其他好文   时间:2014-10-16 19:41:13    阅读次数:202
利用Hive实现求两条相邻数据时间差
1.Hive row_number() 函数的高级用法 row_num 按照某个字段分区显示第几条数据select imei,ts,fuel_instant,gps_longitude,gps_latitude,row_number() over (PARTITION BY imei ORDER B...
分类:其他好文   时间:2014-10-16 12:19:22    阅读次数:409
hive的shims相关类分析
在hive的源码中经常可以看到shims相关的类,shims相关类是用来兼容不同的hadoop和hive版本的,以HadoopShims为例org.apache.hadoop.hive.shims.HadoopShims是一个接口,具体的实现类为org.apache.hadoop.hive.shims.Hadoop20Shims org.apache.hadoop.hive.shims.Hadoop20SShims..
分类:其他好文   时间:2014-10-16 04:34:52    阅读次数:234
在集群上安装Hive
1、先决条件要求必须已经安装完成Hadoop,Hadoop的安装在之前的博文《VMware下Hadoop2.4.1完全分布式集群平台安装与设置》有详细介绍过。2、下载Hive安装包当前最新版本为0.13.1,可以到官网下载最新版,下载地址为:http://archive.apache.org/dist/hive/下载完之后,将安装包..
分类:其他好文   时间:2014-10-16 04:00:22    阅读次数:375
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!