码迷,mamicode.com
首页 >  
搜索关键字:hive    ( 5904个结果
Shell脚本执行hive语句 | hive以日期建立分区表 | linux schedule程序
Shell脚本执行hive语句 | hive以日期建立分区表 | linux schedule程序...
分类:系统相关   时间:2014-08-21 13:25:44    阅读次数:350
hive 创建/删除/截断 表(翻译自Hive wiki)
这里罗列常用操作,更多参考https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-Create%2FDrop%2FTruncateTable简单的创建表create table tab...
分类:其他好文   时间:2014-08-21 11:21:24    阅读次数:234
hive中的NULL
今天测试了一下类似null = ‘abc‘之类的表达式在hive sql中的值。 总结如下: 有null参与的所有比较运算结果都为null。例如:null = ‘a‘; ‘a‘ = null; null > 1; null != 1; 当where子句中出现null = ‘a‘这类结果为...
分类:其他好文   时间:2014-08-20 22:50:33    阅读次数:265
【甘道夫】Hive 0.13.1 on Hadoop2.2.0 + Oracle10g部署详解
环境: hadoop2.2.0 hive0.13.1 Ubuntu 14.04 LTS java version "1.7.0_60" Oracle10g 到以下地址下载安装包 http://mirrors.cnnic.cn/apache/hive/stable/apache-hive-0.13.1-bin.tar.gz...
分类:数据库   时间:2014-08-20 19:43:12    阅读次数:363
hive小结(一 )
hive partitions hdfs 内部表 外部表 view...
分类:其他好文   时间:2014-08-20 19:39:52    阅读次数:191
hiverc文件的加载实现
使用过hive的都知道,可以通过指定-i参数或者配置.hiverc来设置hive启动时初始执行的一些命令,比如可以把udf的定义写到.hiverc文件中。加载.hiverc的过程是在CliDriver类中定义的。具体的方法调用顺序:main--->run--->executeDriver----->processInitFiles---->p..
分类:其他好文   时间:2014-08-20 10:38:26    阅读次数:295
hive入口​CliDriver分析
CliDriver类是hive的入口类。首先CliDriver类会通过OptionsProcessor类来parse输入的命令。比如解析-e,-s,-h等参数,然后把对应的值存放到对应的CliSessionState类的属性中,最后应用于CliDriver类中。比如在executeDriver方法中,根据CliSessionState的属性对命令进行处理CliD..
分类:其他好文   时间:2014-08-20 02:45:56    阅读次数:210
hive 子查询特别分析
转自:http://blog.csdn.net/ls3648098/article/details/9630357Hive只支持在FROM子句中使用子查询,子查询必须有名字,并且列必须唯一:SELECT ... FROM(subquery) name ...确认下是否一定要求列必须唯一? 建表语句:...
分类:其他好文   时间:2014-08-19 20:37:05    阅读次数:196
hive SQL count时的'\N'
Hive中有种假NULL,它看起来和NULL一摸一样,但是实际却不是NULL。例如如下这个查询:hive> desc ljn004;OKastringTime taken: 0.237 secondshive> select a from ljn004;OKNULLTime taken: 46.23...
分类:数据库   时间:2014-08-19 20:28:45    阅读次数:306
怎样去找出线上hive或mapreduce运行慢的原因
hive mapreduce 都会转成java。所以要用的java分析工具。当看到map或reduce 阶段运行缓慢,我们去线上找到mapreduce的进程: 1. top 发现进程: 2. top -Hp 32486 找到进程中cpu或mem磁盘消耗最高的线程: 3.  用jstack主要用来查看某个Java进程内的线程堆栈信息: bin/jstack -F 26510 ...
分类:其他好文   时间:2014-08-19 19:14:35    阅读次数:291
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!