码迷,mamicode.com
首页 >  
搜索关键字:hive    ( 5904个结果
Hive中使用LZO
hive 中使用lzo 1 启动hive 错误Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/hive/conf/HiveConf at java.lang.Class.forName0(Na....
分类:其他好文   时间:2014-09-01 17:27:43    阅读次数:545
-- process information unavailable 解决
今天手动kill掉hive thrive进程,jps出现了“-- process information unavailable”,很怪异。。。问题解决:进入tmp目录, 删除该目录下名称为hsperfdata_{username}的文件夹然后jps,世界清静了。
分类:其他好文   时间:2014-09-01 13:50:13    阅读次数:223
数据仓库中的 SQL 性能优化(Hive篇)
一个Hive查询生成多个map reduce job,一个map reduce job又有map,reduce,spill,shuffle,sort等多个阶段,所以针对hive查询的优化可以大致分为针对MR中单个步骤的优化(其中又会有细分),针对MR全局的优化,...
分类:数据库   时间:2014-08-31 03:58:10    阅读次数:496
hive 使用脚本清洗数据:时间戳转日期
import sysimport datetimefor line in sys.stdin: line = line.strip() userid, movieid, rating, unixtime = line.split('\t') weekday = datetime.datetim...
分类:其他好文   时间:2014-08-31 00:17:50    阅读次数:1780
ubuntu redis的安装
http://blog.fens.me/linux-redis-install/在Ubuntu中安装RedisR利剑NoSQL系列文章,主要介绍通过R语言连接使用nosql数据库。涉及的NoSQL产品,包括Redis,MongoDB,HBase,Hive,Cassandra,Neo4j。希望通过我的...
分类:其他好文   时间:2014-08-30 17:43:49    阅读次数:328
hive j简单邮件过滤
select min(call_log), a.mail_subject from (select mail_to,mail_subject from dw_user_deviler_201408 where log_date>=20140825 and mail_subject not ...
分类:其他好文   时间:2014-08-29 15:54:38    阅读次数:177
hive 行转列 并添加虚列
select regexp_extract(a.col2,'(phonenum=\")(.*?)\"',2) user_device, regexp_extract(a.col13,'(imsicode=\")(.*?)\"',2) imsi, regexp_extract(a.col12,...
分类:其他好文   时间:2014-08-29 13:00:07    阅读次数:205
自定义hive的Inputformat
项目背景: 本公司需要处理一份数据,这份数据有这样的特点,一行数据长度是1924个,一共有88个字段,且知道每个字段按顺序的长度。但是如果直接创建表的话也是行的,只不过写很复杂的正则表达式。而且效率方面可...
分类:其他好文   时间:2014-08-29 11:17:58    阅读次数:286
一例 Hive join 优化实战
由于 hive 与传统关系型数据库面对的业务场景及底层技术架构都有着很大差异,因此,传统数据库领域的一些技能放到 Hive 中可能已不再适用。关于 hive 的优化与原理、应用的文章,前面也陆陆续续的介绍了一些,但大...
分类:其他好文   时间:2014-08-29 05:13:27    阅读次数:293
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!