基础介绍
分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连,也就是集群文件系统,可以支持大数量的节点以及PB级的数据存储。
常见的分布式文件系统
GFS、HDFS、GridFS、mogileFS、TFS、fastDFS等。
GFS(Google File System):google公司为了满足本公司需求而开发的基于linux的专有分布式文件系统。不过很可惜该系统并未开源
HDFS: Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。是运行在通用硬件上的分布式文件系统。HDFS提供了一个高度容错性和高吞吐量的海量数据存储解决方案。
MogileFS:开源的分布式文件系统,用于组建分布式文件集群,由 LiveJournal 旗下 DangaInteractive 公司开发,Danga 团队开发了包括 Memcached、MogileFS、Perlbal 等不错的开源项目:(注:Perlbal 是一个强大的 Perl 写的反向代理服务器)。目前国内使用 MogileFS 的有图片托管网站 yupoo 等。
FastDFS:是一款类似GoogleFS的开源分布式文件系统。是为互联网应用量身定做的分布式文件系统,统分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标。
分布式文件系统特点
可以组建包含大量廉价服务器的海量存储系统。
通过内部的冗余复制,保证文件的可以用性,在海量存储系统中,容错能力非常重要;
可扩展性强,增加存储节点和追踪器都比较容易
在对个文件副本之间就进行负载均衡,可以通过横向扩展来确保性能的提升;
进行特定的索引文件计算等;
本文出自 “秋季” 博客,请务必保留此出处http://lxlxlx.blog.51cto.com/3363989/1902457
原文地址:http://lxlxlx.blog.51cto.com/3363989/1902457