码迷,mamicode.com
首页 > 其他好文 > 详细

强-大数据第三讲

时间:2019-07-12 11:24:48      阅读:91      评论:0      收藏:0      [点我收藏+]

标签:分布式计算   apr   拆分   本质   sys   ado   pagerank   info   inf   

Hadoop的背景起源二:MapReduce

一、什么是大数据,本质?
(1)数据的存储:分布式文件系统(分布式存储)-----> HDFS: Hadoop Distributed File System
(2)数据的计算:分布式计算

二、如何解决大数据的计算?分布式计算
(1)什么是PageRank(MapReduce的问题的来源)
(*) 搜索排名

(2)MapReduce(Java语言实现)基础编程模型: 把一个大任务拆分成小任务,再进行汇总
(*) 更简单一点例子

 

技术图片

 

技术图片

强-大数据第三讲

标签:分布式计算   apr   拆分   本质   sys   ado   pagerank   info   inf   

原文地址:https://www.cnblogs.com/Zac1010/p/11174815.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!