分布式文件系统架构GFS、HDFS、TFS、Haystack
分布式文件系统通常可以作为底层存储,如GFS作为Google bigtable的底层,EBS作为 Amazon RDS的底 层,HDFS作为HBase的底层文件系统
其中,TFS,QFS以及Haystack需要解决的问题以及架构都很类似,这三个文件系统称为Blob FS (Blob File System)。本文从分布式架构的角度对三种典型的文件系统进行对比。
GFS --------------- HDFS
HDFS基本可以认为是GFS的一个简化版实现,二者因此有很多相似之处
GFS和HDFS在关键点的设计上差异很大,HDFS为了规避GFS的复杂度进行了很多简化
a) GFS垃圾回收采用惰性回收策略,即master并不会立即回收程序所删除的文件资源。 GFS选择以一种特定的形式标记删除文件(通常是将文件名改为一个包含时间信息的隐藏名字),这样的文件不再被普通用户所访问。Master会定期对文件的命名空间进行检查,并删除一段时间前的隐藏文件(默认3天)。
b) HDFS并没有采用这样的垃圾回收机制,而是采取了一种更加简单但是更容易实现的直接删除方式。
c) 应该说延迟回收和直接删除各有优势。延迟回收为那些“不小心“的删除操作留了后路。同时,回收资源的具体操作时在Master结点空闲时候完成,对GFS的性能有很好的提高。但是延迟回收会占用很大的存储空间,假如某些可恶的用户无聊了一直创建删除文件怎么办?
Blob File System和GFS/HDFS的相似之处
Blob File System和GFS/HDFS的区别
Blob File System和GFS/HDFS二者分别面临的问题
分布式文件系统架构GFS、HDFS、TFS、Haystack
原文地址:http://blog.csdn.net/yujin753/article/details/43236647