awk除去重复行

时间：2016-08-18 14:14:29 阅读：147 评论：0 收藏：0 [点我收藏+]

标签：

awk去除重复行，思路是以每一行的$0为key，创建一个hash数组，后续碰到的行，如果数组里已经有了，就不再print了，否则将其print

测试文件：

技术分享

用awk：

技术分享

用sort+uniq好像出错了：

技术分享

到底是为什么uniq出错了呢？不知道，但是awk真的很强大。两者的差异还在于，awk保持了文件中原本的每行的顺序，而sort必须排序，这样就变成按字母或某种其他规则的排序了。

PS：uniq出错好像是因为\r\n的问题。

PS：错了。有的教程上，uniq -u就跟uniq是一样的。我用cygwin，uniq- u只显示不重复行，uniq则显示所有行，只不过去除重复。

技术分享

标签：

原文地址：http://www.cnblogs.com/litao0505/p/5783520.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行