标签:丢失 异常 最大 目标 系统设计 服务端 吞吐量 调用 分布
文件系统的一致性和应用程序的方法有关,如果不调用sync(),就需要做好因为客户端异常或者服务端故障而缺失部分数据。缺失数据这对应用来说是不可接受的。所以需要在合适的地方调用sync(),比如在写入一定量的数据后,尽管sync()用来最大限度的减轻hdfs的负担,但是他仍有不可忽视的开销。所以你需要在数据的健壮性和吞吐量之间做好权衡,其中一个好的平衡点:通过测试应用程序来选择sync频率间性能的平衡点
标签:丢失 异常 最大 目标 系统设计 服务端 吞吐量 调用 分布
原文地址:http://www.cnblogs.com/zhangXingSheng/p/6222576.html