码迷,mamicode.com
首页 >  
搜索关键字:hive udf    ( 6169个结果
Apache DataFu: LinkedIn开源的Pig UDF库
Apache DataFu分两部分,本文介绍的是其Pig UDF的部分。代码在Github上开源。 DataFu里面是一些Pig的UDF,主要包括这些方面的函数: bags、geo、hash、linkanalysis、random、sampling、sessions、sets、stats、urls 每方面都对应一个package。 我把所有的函数源码都浏览了一遍。其实本身对这些UDF的使用,官方的文档上都有介绍,而且源码的注释里也些的很清晰。所以使用本身是很简单的。 从实现角度看,继承自Pig Ev...
分类:其他好文   时间:2014-05-09 01:14:25    阅读次数:436
eclipse连接hive所需包
分类:系统相关   时间:2014-05-09 00:57:13    阅读次数:508
hive0.13安装
1.COPY配置文件:cphive-default.xml.templatehive-site.xmlcphive-env.sh.templatehive-env.shcphive-exec-log4j.properties.templatehive-exec-log4j.propertiescphive-log4j.properties.templatehive-log4j.properties2.配置HADOOP主目录:vimhive-env.shHADOOP_HOME=/usr/a..
分类:其他好文   时间:2014-05-09 00:51:29    阅读次数:282
Hadoop生态系统
摘要:介绍Hadoop生态系统,从Hadoop生态系统有什么成员,成员能做什么和Hadoop生态系统能够提供大数据问题解决方案两方面来认识。关键词:Hadoop HDFS MapReduce HBase Hive PigHadoop生态图,通俗地说,就是Hadoop核心模块和衍生的子项目。一幅Ha....
分类:其他好文   时间:2014-05-08 23:16:24    阅读次数:387
hive行转多列LATERAL VIEW explode
源表(table1)数据{A:string B:array C:string}A B C190 [1030,1031,1032,1033,1190] select id191 [1030,1031,1032,1033,1190] select id希望的结果是:190 1030 select id1...
分类:其他好文   时间:2014-05-08 14:19:57    阅读次数:311
hive 中 union all
hive 中的union all是不能在sql语句的第一层使用的,否则会报Top level UNION is not supported currently 错误;例如如下的方式:select id,name from user where type = 1union allselect id,n...
分类:其他好文   时间:2014-05-08 07:17:42    阅读次数:420
hive-mysql安装配置
默认情况下,hive的元数据信息存储在内置的Derby数据中。Facebook将hive元数据存储在关系数据库1、安装好mysql ,sudo apt-get install mysql-server2、创建mysql用户hadoop $mysql-uroot-p 进入root用户 mysql>.....
分类:数据库   时间:2014-05-07 20:40:00    阅读次数:554
hive的union问题
内容来源:http://blog.csdn.net/azhao_dn/article/details/6921429在hive上执行查询:select count(*) from user_active_vv_20110801_31 where active_type_3>0 UNION ALL s...
分类:其他好文   时间:2014-05-07 20:26:30    阅读次数:460
hive实践(hive0.12)
版本:cdh5.0.0+hadoop2.3.0+hive0.12一、原始数据:1. 本地数据[root@node33 data]# ll total 12936 -rw-r--r--. 1 root root 13245467 May 1 17:08 hbase-data.csv [root@node33 data]# head -n 3 hbase-data.csv 1,1.52101,13...
分类:其他好文   时间:2014-05-06 22:24:07    阅读次数:437
Hive中join, outer join, semi join区别
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 最常用的就是多表关联查询,主要讲解下join、outer join和semi join的具体使用。 join是最简单的关联操作,两边关联只取交集。 outer join分为left outer join、rig...
分类:其他好文   时间:2014-05-06 15:01:38    阅读次数:269
6169条   上一页 1 ... 614 615 616 617 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!