码迷,mamicode.com
首页 > 其他好文 > 详细

awk除去重复行

时间:2016-08-18 14:14:29      阅读:147      评论:0      收藏:0      [点我收藏+]

标签:

awk去除重复行,思路是以每一行的$0为key,创建一个hash数组,后续碰到的行,如果数组里已经有了,就不再print了,否则将其print

 

测试文件:

 

技术分享

 

用awk:

技术分享

技术分享

 

用sort+uniq好像出错了:

技术分享

 

到底是为什么uniq出错了呢?不知道,但是awk真的很强大。两者的差异还在于,awk保持了文件中原本的每行的顺序,而sort必须排序,这样就变成按字母或某种其他规则的排序了。

 

 

PS:uniq出错好像是因为\r\n的问题。

PS:错了。有的教程上,uniq -u就跟uniq是一样的。我用cygwin,uniq- u只显示不重复行,uniq则显示所有行,只不过去除重复。

 

 技术分享

 
 

awk除去重复行

标签:

原文地址:http://www.cnblogs.com/litao0505/p/5783520.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!