标签:
基本概念:
重复执行 出错有可能是硬件的问题,也有可能是数据的问题,首先会进行重复执行,如果重复执行了4次还是错误,那么就放弃
推测执行 Map端都算完之后,可能会出现某个节点算得特别慢的情况。这个时候JobTracker可能会认为该节点算得特别慢可能是出现了问题,那么这个时候就会增加一台TaskTracker执行,两个节点谁先算完,就把另一个的任务计算丢弃
hadoop笔记之MapReduce的运行流程
原文地址:http://www.cnblogs.com/XBlack/p/5023582.html