码迷,mamicode.com
首页 >  
搜索关键字:mapred    ( 464个结果
【甘道夫】官方网站MapReduce代码注释具体实例
引言1.本文不描写叙述MapReduce入门知识,这类知识网上非常多。请自行查阅2.本文的实例代码来自官网http://hadoop.apache.org/docs/current/hadoop-mapreduce-client/hadoop-mapreduce-client-core/MapRed...
分类:Web程序   时间:2015-10-01 11:37:06    阅读次数:163
[Hadoop] - TaskTracker源码分析(TaskTracker节点健康状况监控)
在TaskTracker中对象healthStatus保存了当前节点的健康状况,对应的类是org.apache.hadoop.mapred.TaskTrackerStatus.TaskTrackerHealthStatus。定义如下:static class TaskTrackerHealthS.....
分类:其他好文   时间:2015-09-21 19:33:38    阅读次数:165
hadoop三个配置文件的参数含义说明core-site.xml,hdfs-site.xml,mapred-site.xml
配置hadoop,主要是配置core-site.xml,hdfs-site.xml,mapred-site.xml三个配置文件,默认下来,这些配置文件都是空的,所以很难知道这些配置文件有哪些配置可以生效,上网找的配置可能因为各个hadoop版本不同,导致无法生效。浏览更多的配置,有两个方法:1.选择...
分类:其他好文   时间:2015-09-15 23:04:50    阅读次数:208
大数据之sqoop
安装:1 解压然后把mysql的驱动放在$SQOOP_HOME/lib 目录中2. conf/sqoop-en.shexport HADOOP_COMMON_HOME=/home/hadoop/hadoop/hadoop-2.3.0export HADOOP_MAPRED_HOME=/home/ha...
分类:其他好文   时间:2015-09-05 09:50:33    阅读次数:128
Hive中set相关设置
以下操作均可在$HIVE_HOME/bin/.hiverc文件中保存,设置为默认参数set hive.mapred.mode=strict;//开启strict模式,以下情况报错:(1)没有limit限制的order by语句.(2)动态分区插入set hive.cli.print.current....
分类:其他好文   时间:2015-09-04 12:32:17    阅读次数:167
reduce的数目到底和哪些因素有关
reduce的数目到底和哪些因素有关1、我们知道map的数量和文件数、文件大小、块大小、以及split大小有关,而reduce的数量跟哪些因素有关呢?设置mapred.tasktracker.reduce.tasks.maximum的大小可以决定单个tasktracker一次性启动reduce的数目...
分类:其他好文   时间:2015-08-28 21:18:34    阅读次数:278
hadoop1 & hadoop2 fair-schduler 配置和使用
hadoop1 配置 mapred-site.xml,增加如下内容 mapred.jobtracker.taskScheduler org.apache.hadoop.mapred.FairScheduler <...
分类:其他好文   时间:2015-08-28 13:23:03    阅读次数:139
kerberos下HBase访问Zookeeper的ACL问题
最近公司HBase(CDH-4.6.0)遇到了一个麻烦问题,觉得有必要记录下整个解决的过程。问题起因用户在跑mapreduce任务,从hdfs读取文件想写入到hbase table的时候失败了(这是hbase提供的一种mapred能力)。这个问题发现在A环境(一个测试环境),自从启用了kerberos之后。运行了用户给的程序和自己写的sample之后,发现程序最后挂在NullPointerExcep...
分类:其他好文   时间:2015-08-27 15:22:43    阅读次数:219
hadoop MR 任务 报错 "Error: java.io.IOException: Premature EOF from inputStream at org.apache.hadoop.io"
错误原文分析文件操作超租期,实际上就是data stream操作过程中文件被删掉了。通常是因为Mapred多个task操作同一个文件,一个task完成后删掉文件导致。这个错误跟dfs.datanode.max.transfer.threads参数到达上限有关。这个是datanode同时处理请求的任务上限,总默认值是 4096,该参数取值范围[1 to 8192]hadoop docs hdfs-si...
分类:编程语言   时间:2015-08-17 14:05:57    阅读次数:176
(转)系统设计题要考虑的方面
Cache:缓存,万金油,哪里不行优先考虑Queue:消息队列,常见使用Linkedin的kafkaAsynchronized:批处理+异步,减少系统IO瓶颈Load Balance: 负载均衡,可以使用一致性hash技术做到尽量少的数据迁移Parallelization:并行计算,比如MapRed...
分类:其他好文   时间:2015-08-16 19:39:17    阅读次数:203
464条   上一页 1 ... 34 35 36 37 38 ... 47 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!