每日一题--2

时间：2018-10-08 21:40:15 阅读：144 评论：0 收藏：0 [点我收藏+]

题目2 统计字符串

使用awk统计出来指定字符串中重复出现的字符并重复出现了几次，现在只考虑有数字和字母，先区分大小写
eg：
aaabbc------> a 重复出现3次，b重复出现了2次
abababdcac--> a 重复出现了4次，b重复出现了3次，c重复出现了2次

第一个里程碑：
先不考虑样式和要求，先输出所有字符串出现的次数

//我们先使用awk把单个字符串取出来
[root@web01-7 /]# echo "aaabbc" | awk -F "" ‘{$1=$1;print $0}‘
a a a b b c
//$1=$1我们可以发现他其实里面的原始值没有变，但是我们这样写就是为了让awk的数据重构
[root@web01-7 /]# echo "aaabb" | awk -F  "" ‘{for(i=1;i<=NF;i++){sum[$i]++}}END{for(j in sum)print sum[j],j}‘ 
3 a
2 b
1 c
//使用awk数据求和来取出每个字母出现的次数，并输出

第二个里程碑：
把重复出现2次以上的给打印出来，只出现1次的不打印

[root@web01-7 /]# echo "aaabbc" | awk -F  "" ‘{for(i=1;i<=NF;i++){sum[$i]++}}END{for(j in sum)if(sum[j]>=2)print sum[j],j}‘ 
3 a
2 b

第三个里程碑
按照题目要求的格式化输出

echo "aaabbc" | awk -F  "" ‘{for(i=1;i<=NF;i++) {sum[$i]++}} END{{ for (j in sum) if ( sum[j]>=2 ) printf"%s重复出现%s次\t",j, sum[j]} printf"\n"}‘

进阶版：不区分大小统计（应该能简化？？）

[root@web01-7 /]# echo "AAaaabbc" | awk ‘{print tolower($0)}‘ | awk -F  "" ‘{for(i=1;i<=NF;i++) {sum[$i]++}} END{{ for(j in sum) if ( sum[j]>=2 ) printf"%s 重复出现%次 \",j, sum[j]} printf"\n"}‘                      
a重复出现5次    b重复出现2次

总结

1，awk可以使用-F "" 这种方式来分割单个字符
2，awk中可以使用函数tolower()把所有大写的字母替换成小写的
3，awk中可以使用函数toupper()把所有小写的字母替换成大写的
4，也可以使用BEGIN{IGNORECASE=1}来屏蔽awk匹配的时候区分大小写，要记得这个在awk的兼容模式下不能用

每日一题--2

标签：awk 字符 ++ 区分兼容模式 %s 就是大写 print

原文地址：http://blog.51cto.com/13447608/2296030

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行