标签:分割 none app 响应 tar targe 写入 性能 过程
1. 常用 rcfile + gzip
parquet + snappy
2. 压缩比,参考
如果是数据源的话,采用 RCFile+bz 或 RCFile+gz 的方式,这样可以很大程度上节省磁盘空间;
而在计算的过程中,为了不影响执行的速度,可以浪费一点磁盘空间,建议采用 RCFile+snappy 的方式,这样可以整体提升hive的执行速度。
至于lzo的方式,也可以在计算过程中使用,只不过综合考虑(速度和压缩比)还是考虑snappy适宜。
标签:分割 none app 响应 tar targe 写入 性能 过程
原文地址:http://www.cnblogs.com/skyEva/p/7489368.html