标签:取数据 www 结果 作业 管理 访问日志 归约 流程 多个
课程链接:Hadoop大数据平台架构与实践--基础篇
分而治之,一个大任务分成多个小的子任务(map),并行执行后,合并结果(reduce)
问题1:1000副扑克牌少哪一张牌(去掉大小王)
问题2:100GB的网站访问日志文件,找出访问次数最多的IP地址
MapReduce原理与实现
原文地址:https://www.cnblogs.com/exciting/p/9210891.html