1.Tachyon简介Tachyon是一个高容错的分布式文件系统,允许文件以内存的速度在集群框架中进行可靠的共享,就像Spark和 MapReduce那样。通过利用信息继承,内存侵入,Tachyon获得了高性能。Tachyon工作集文件缓存在内存中,并且让不同的 Jobs/Queries以及框架都能...
分类:
其他好文 时间:
2014-08-27 18:32:08
阅读次数:
454
前言: Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,...
分类:
其他好文 时间:
2014-08-26 09:51:26
阅读次数:
502
引言 Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高 度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐....
分类:
其他好文 时间:
2014-08-22 12:29:26
阅读次数:
260
FastDFS安装FastDFS是一个国产开源的轻量级分布式文件系统,它对文件进行管理,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题.特别适合以文件为载体的在线服务,如相册网站、视频网站等等.FastDFS服务端有两个角色:跟踪器(trac..
分类:
其他好文 时间:
2014-08-19 11:06:15
阅读次数:
468
本文提出了一个基于P2P的分布式文件系统的构想。它采用蜂群思想(受《失控》启发),最大化单个节点的智能性来实现群体存储的智能性。它的优点是支持无限扩容,动态添加和删除节点,自动优化存储,以及超强的容灾能力。...
分类:
其他好文 时间:
2014-08-18 16:23:32
阅读次数:
258
摘要 Hadoop分布式文件系统(HDFS)设计用来可靠的存储超大数据集,同时以高速带宽将数据集传输给用户应用。 在一个超大集群中,数以千计的服务器直接接触存储器和执行用户应用任务。通过许多服务器的分布式存储和...
分类:
其他好文 时间:
2014-08-18 12:43:04
阅读次数:
356
HDFS Hadoop的核心就是HDFS与MapReduce。那么HDFS又是基于GFS的设计理念搞出来的。 HDFS全称是Hadoop Distributed System。HDFS是为以流的方式存取大文件而设计的。适用于几百MB,GB以及TB,并写一次读多次的场合。而对于低延时数据访问、大量小文...
分类:
其他好文 时间:
2014-08-18 12:21:14
阅读次数:
228
分布式文件系统 Google File System:是由google开发并设计的一个面向大规模数据处理的一个分布式文件系统。 我们首先来简单的说明一下这个分布式,我们都知道现在要存储的数据量越来越大,但是一台电脑的存储能力是有限的,尽管我们可以通过提高某台电脑的存储能力来解决这个问题,但是这是.....
分类:
其他好文 时间:
2014-08-17 23:58:03
阅读次数:
440
??本文讲的分布式文件系统,是通过集群来实现的,因此也是集群文件系统。本文介绍下分布式文件系统中的常见问题及GFS中给出的解决方法。设计要点:性能提高性能的方法就是并行,讲一个任务分解成多个任务,同一时候运行。GFS中的思路是将文件分块,每一个块是一个chunk,每一个chunk单独保存,保存chu...
分类:
其他好文 时间:
2014-08-17 18:22:42
阅读次数:
293
HDFS Architecture
Introduction
HDFS是分布式文件系统,它被设计为运行在普通商用硬件之上。它与已经存在的文件系统有很多相似性。但是,也有巨大的不同。HDFS有很高的容错,被设计为部署在低廉的硬件上。HDFS提供为应用程序的数据提供一个高通量的访问,适合有大量数据的应用程序。HDFS放松了一些POSIX的需求,以使可以用流的方式访问文件系统的数据。HDFS最初作为...
分类:
其他好文 时间:
2014-08-17 17:02:32
阅读次数:
249