Shell脚本执行hive语句 | hive以日期建立分区表 | linux schedule程序...
分类:
系统相关 时间:
2014-08-21 13:25:44
阅读次数:
350
这里罗列常用操作,更多参考https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-Create%2FDrop%2FTruncateTable简单的创建表create table tab...
分类:
其他好文 时间:
2014-08-21 11:21:24
阅读次数:
234
今天测试了一下类似null = ‘abc‘之类的表达式在hive sql中的值。 总结如下: 有null参与的所有比较运算结果都为null。例如:null = ‘a‘; ‘a‘ = null; null > 1; null != 1; 当where子句中出现null = ‘a‘这类结果为...
分类:
其他好文 时间:
2014-08-20 22:50:33
阅读次数:
265
环境:
hadoop2.2.0
hive0.13.1
Ubuntu 14.04 LTS
java version "1.7.0_60"
Oracle10g
到以下地址下载安装包
http://mirrors.cnnic.cn/apache/hive/stable/apache-hive-0.13.1-bin.tar.gz...
分类:
数据库 时间:
2014-08-20 19:43:12
阅读次数:
363
hive partitions hdfs 内部表 外部表 view...
分类:
其他好文 时间:
2014-08-20 19:39:52
阅读次数:
191
使用过hive的都知道,可以通过指定-i参数或者配置.hiverc来设置hive启动时初始执行的一些命令,比如可以把udf的定义写到.hiverc文件中。加载.hiverc的过程是在CliDriver类中定义的。具体的方法调用顺序:main--->run--->executeDriver----->processInitFiles---->p..
分类:
其他好文 时间:
2014-08-20 10:38:26
阅读次数:
295
CliDriver类是hive的入口类。首先CliDriver类会通过OptionsProcessor类来parse输入的命令。比如解析-e,-s,-h等参数,然后把对应的值存放到对应的CliSessionState类的属性中,最后应用于CliDriver类中。比如在executeDriver方法中,根据CliSessionState的属性对命令进行处理CliD..
分类:
其他好文 时间:
2014-08-20 02:45:56
阅读次数:
210
转自:http://blog.csdn.net/ls3648098/article/details/9630357Hive只支持在FROM子句中使用子查询,子查询必须有名字,并且列必须唯一:SELECT ... FROM(subquery) name ...确认下是否一定要求列必须唯一? 建表语句:...
分类:
其他好文 时间:
2014-08-19 20:37:05
阅读次数:
196
Hive中有种假NULL,它看起来和NULL一摸一样,但是实际却不是NULL。例如如下这个查询:hive> desc ljn004;OKastringTime taken: 0.237 secondshive> select a from ljn004;OKNULLTime taken: 46.23...
分类:
数据库 时间:
2014-08-19 20:28:45
阅读次数:
306
hive mapreduce 都会转成java。所以要用的java分析工具。当看到map或reduce 阶段运行缓慢,我们去线上找到mapreduce的进程:
1. top 发现进程:
2. top -Hp 32486 找到进程中cpu或mem磁盘消耗最高的线程:
3. 用jstack主要用来查看某个Java进程内的线程堆栈信息:
bin/jstack -F 26510
...
分类:
其他好文 时间:
2014-08-19 19:14:35
阅读次数:
291