码迷,mamicode.com
首页 > 其他好文 > 详细

实训第五天

时间:2016-09-02 21:47:52      阅读:129      评论:0      收藏:0      [点我收藏+]

标签:

  今天,我们进行了有关大数据的培训,知道了什么是大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。了解了大数据的应用和趋势,以及大数据的IT分析工具(Hadoop)。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。

  老师给我们讲解了使用Hadoop的优点和核心架构,包括Hadoop Distributed File System(HDFS),NameNode,DataNode,文件操作和Linux 集群。同时介绍了大数据的简单例子。从简单到复杂启蒙了我们对于大数据的认识。

实训第五天

标签:

原文地址:http://www.cnblogs.com/hzsy/p/5835538.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!