码迷,mamicode.com
首页 >  
搜索关键字:cdh hive 释放空间    ( 6666个结果
Hadoop、Pig、Hive、NOSQL 学习资源收集
(一)hadoop 相关安装部署1、hadoop在windows cygwin下的部署:http://lib.open-open.com/view/1333428291655http://blog.csdn.net/ruby97/article/details/7423088http://blog....
分类:数据库   时间:2014-07-22 22:50:55    阅读次数:517
Hive基本命令整理
创建表: hive> CREATE TABLE pokes (foo INT, bar STRING); Creates a table called pokes with two columns, the first being an integer and the other a string....
分类:其他好文   时间:2014-07-22 22:50:54    阅读次数:262
Hive参数层面优化之二控制Reduce数
Reduce数决定中间或落地文件数,文件大小和Block大小无关。1、Reduce个数的决定因素reduce个数的设定极大影响任务执行效率,不指定reduce个数的情况下,Hive会猜测确定一个reduce个数,基于以下两个设定:参数1:hive.exec.reducers.bytes.per.re...
分类:其他好文   时间:2014-07-20 09:12:58    阅读次数:335
sqoop 从mysql导入hive的字段名称问题
hive中有些关键字限制,因此有些字段名称在mysql中可用,但是到了hive就不行。比如order必须改成order1, 下面列出了我们发现的一些不能在hive中使用的字段名称order  => order1sort => sort1reduce => reduce1cast => cast1directory => directory1...
分类:数据库   时间:2014-07-19 11:33:04    阅读次数:263
从hive将数据导出到mysql(转)
从hive将数据导出到mysqlhttp://abloz.com2012.7.20author:周海汉在上一篇文章《用sqoop进行mysql和hdfs系统间的数据互导》中,提到sqoop可以让RDBMS和HDFS之间互导数据,并且也支持从mysql中导入到HBase,但从HBase直接导入mysq...
分类:数据库   时间:2014-07-18 20:00:07    阅读次数:482
递归遍历目录拷贝cdh下的lib到一个目录
destpath='/home/hadoop/soft/hadoop-2.0.0-cdh4.5.0/cdhlib/'jarpath='/home/hadoop/soft/hadoop-2.0.0-cdh4.5.0/share/hadoop/'search='jar'iterdir(){ cd $1 ...
分类:其他好文   时间:2014-07-18 16:35:53    阅读次数:225
Hive架构层面优化之七压缩
常见的压缩有:对中间结果压缩、对输出结果压缩。压缩对比:算法压缩前/压缩后压缩速度解压速度GZIP13.4%21MB/s118 MB/sLZO20.5%135 MB/s410 MB/sSnappy22.2%172 MB/s409 MB/sSnappy介绍:Snappy 网站:http://code....
分类:其他好文   时间:2014-07-18 16:12:24    阅读次数:352
Hive ERROR: Out of memory due to hash maps used in map-side aggregation .
当hive在执行大数据量的统计查询语句时,经常会出现下面OOM错误,具体错误提示如下:Possible error: Out of memory due to hash maps used in map-side aggregation.Solution: Currently hive.map.ag...
分类:其他好文   时间:2014-07-18 11:37:23    阅读次数:305
Hive架构层面优化之六分布式缓存
案例:Hadoop jar引用:hadoop jar -libjars aa.jar bb.jar ….jar包会被上传到hdfs,然后分发到每个datanode假设有20个jar文件,每天jar文件被上传上万次,分发达上万次(百G级),造成很严重的IO开销。如何使这些jar包在HDFS上进行缓存,...
分类:其他好文   时间:2014-07-18 00:23:59    阅读次数:265
日志分析方法概述
最近几年日志分析这方面的人才需求越来越多,主要伴随数据挖掘的快速发展而迅速增长的。碰巧又在工作中又接触到一些日志记录方面的工作,就顺便了解一下日志系统的整个流程。下面这篇文章转自百度同学的一篇文章,针对大规模日志分析,联系到hadoop,hive的解决方案,阐述的比较全面。 另外就是阿里已经开发出类似的系统odps—通过sql语言进行数据的分析处理,详情见:http://102.alibab...
分类:其他好文   时间:2014-07-17 20:15:30    阅读次数:301
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!