标签:ges reduce blog file 压缩 方式 .com map rac
1.存储格式
textfile
rcfile
orc
parquet
2.存储方式
按行存储
-》textfile
按列存储
-》parquet
3.压缩比
4.存储textfile的原文件
并加载数据
5.大小
6.保存为tectfile,经过mapreduce
7.结果的大小
8.保存为orc格式
9.大小
10.存储为parquet
11.大小
12.使用命令求大小
bin/hdfs dfs -du -s -h /user/hive/warehouse/track_log.db/yhd_par
标签:ges reduce blog file 压缩 方式 .com map rac
原文地址:http://www.cnblogs.com/juncaoit/p/6067646.html