码迷,mamicode.com
首页 > 其他好文 > 详细

awk 数据处理小技巧

时间:2015-03-17 13:58:20      阅读:90      评论:0      收藏:0      [点我收藏+]

标签:

进行数据分析或统计时,如果数据量较小,我们可以用awk快速处理,以下是一些小技巧
 
一、时间戳转换
日期转时间戳: date -d "20150315"  "+%s"
时间戳转日期:date -d @1426565428 "+%Y-%m-%d"
 
二、数据统计处理
随机取100个数
awk ‘BEGIN{srand()} {print rand()" "$1}‘ 2.txt | sort -k1 | head -100

取交集
cat 1.txt 2.txt | sort | uniq -d

取并集
cat 1.txt 2.txt | sort | uniq
 
除去交集
cat 1.txt 2.txt | sort | uniq -u
 
求重复出现次数最多的数字
cat 1.txt 2.txt | sort | uniq -c | sort -r -k1 | head -100

求平均数
awk ‘{sum+=$1} END{print "average="sum/NR}‘ 1.txt

三、文件处理
拷贝文件某几行
sed -n ‘1,10p‘ 1.txt > copy.txt

awk 数据处理小技巧

标签:

原文地址:http://www.cnblogs.com/-Lei/p/4344044.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!