首页 > 系统相关 > 详细

Linux下统计出现次数最多的指定字段值

时间：2016-02-22 15:21:04 阅读：233 评论：0 收藏：0 [点我收藏+]

标签：

假设桌面上有一个叫“data.txt”的文本，内容如下：

{id=‘xxx‘ info=‘xxx‘ kk=‘xxx‘ target=‘111111‘ dd=‘xxx‘}
{id=‘xxx‘ info=‘xxx‘ kk=‘xxx‘ target=‘777‘ dd=‘xxx‘}
{id=‘xxx‘ info=‘xxx‘ kk=‘xxx‘ target=‘yyyy‘ dd=‘xxx‘}
{id=‘xxx‘ info=‘xxx‘ kk=‘xxx‘ target=‘5555‘ dd=‘xxx‘}
{id=‘xxx‘ info=‘xxx‘ kk=‘xxx‘ target=‘777‘ dd=‘xxx‘}
{id=‘xxx‘ info=‘xxx‘ kk=‘xxx‘ target=‘555566‘ dd=‘xxx‘}

要求：找出“data.txt”文件中target字段出现次数最多的值。

Linux下统计字符串

在linux终端通过常用工具进行解决，方法如下：

技术分享

其中组合用到了一些命令行和工具，有cat、awk、cut、sed、sort、uniq、tail——

cat

cat data.txt，获取并显示“data.txt”文件的每一行内容：

技术分享

awk

cat data.txt | awk ‘{print $4}‘，显示传入的每一行中第四个字段：

技术分享

cut

cat data.txt | awk ‘{print $4}‘ | cut -c 8-，从传入字符串的第八位开始，截取字符串到最后：

技术分享

sed

cat data.txt | awk ‘{print $4}‘ | cut -c 8- | sed "s/‘//g"，去掉传入字符串中包含的 ‘ 字符：

技术分享

sort

cat data.txt | awk ‘{print $4}‘ | cut -c 8- | sed "s/‘//g" | sort，对结果进行排序：

技术分享

uniq

cat data.txt | awk ‘{print $4}‘ | cut -c 8- | sed "s/‘//g" | sort | uniq -c | sort，去重并统计每种字符串出现的次数：

技术分享

tail

cat data.txt | awk ‘{print $4}‘ | cut -c 8- | sed "s/‘//g" | sort | uniq -c | sort | tail -n 1，显示结果中的最后一行：

技术分享

我们至此已知出现次数最多的target字段值为777，出现次数为2。若有多个相同次数的字段值出现，可以通过修改tail -n后面接的数值来查看，改为10即显示结尾10行。

Linux下统计出现次数最多的指定字段值

标签：

原文地址：http://www.cnblogs.com/LanTianYou/p/5206832.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！