首页 > 其他好文 > 详细

大数据的特征

时间：2018-05-21 10:37:33 阅读：193 评论：0 收藏：0 [点我收藏+]

标签：软件 slave 监控工具输出 2.0 存储系统处理 namenode apr

一、大数据特征

1. 数据体量巨大

2. 数据类型多样（文本，图像，视频，音频）

3. 价值密度低，商业价值高

4.速度要求快，数据输出输入的速度

二、大数据之核心

1.数据的存储

2. 数据的计算（处理）

三、Hadoop

1. Apache开源软件基金会开发的

2. 运行于大规模普通服务器上的

3. 大数据存储、计算、分析

4. 分布式存储系统和分布式运算框架

Hadoop2.0由三部分组成

1. 分布式文件系统HDFS

2. 资源分配系统yarn

3. 分布式运算框架MapReduce

四、Hadoop分布式架构

1. Master/Slave

2.Mater节点

　　NameNode NN

　　SecondaryNameNode SNN

　　ResourceManager rm

3. Slave节点

　　DodeManager NM

　　DataNode DN

五、MapReduce 计算框架

1. 将计算移动到数据

　　硬盘存储成本不断降低

　　传输速率提升不大

　　磁头定位时间无提升

2. MapReduce的特性

　　自动实现分布式并行计算

　　容错

　　提供状态监控工具

　　模型抽象简洁，程序员易用

六、MapReduce函数式编程

Map

　　映射和分发

Reduce

　　汇聚和聚合

大数据的特征

标签：软件 slave 监控工具输出 2.0 存储系统处理 namenode apr

原文地址：https://www.cnblogs.com/sumboy/p/9065675.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！