标签:保存 机制 并发 容错性 2.0 数据 解决 大数据处理 恢复
数据自动保存多个副本
副本丢失后自动恢复
移动计算而非数据
数据位置暴露给计算框架
GB、TB、甚至PB级数据
百万规模以上的文件数据量
10K+结点
通过多副本提高可靠性
提供了容错和恢复机制
占用namenode大量内存(元数据信息)
寻道时间超过读取时间
一个文件只能有一个写者
不支持内容修改,虽然2.0仅支持append,但一般生产环境不会开放(涉及到副本的修改,涉及文件大小改变切分)
标签:保存 机制 并发 容错性 2.0 数据 解决 大数据处理 恢复
原文地址:http://www.cnblogs.com/maikerniuniu/p/7487435.html