标签:
HDFS:
1、分布式文件系统:管理网络中跨多台计算机存储的文件系统
2、hadoop定义了一个抽象文件系统概念,具体就是一个java抽象类:org.apache.hadoop.fs.FileSystm,只要某个文件系统实现了该接口,就可以作为hadoop支持的文件系统
3、数据块:
hdfs中默认存储是64M的数据块,如果一个文件小于64M,并不占用整个数据块
hadoop dfsadmin -report查看HDFS的基本统计信息
感觉讲解不错的文章链接:
http://www.cnblogs.com/sharpxiajun/archive/2013/06/15/3137765.html
http://www.cnblogs.com/xia520pi/archive/2012/05/28/2520813.html
MapReduce:
http://www.cnblogs.com/sharpxiajun/p/3151395.html
标签:
原文地址:http://www.cnblogs.com/zhli/p/4860746.html