码迷,mamicode.com
首页 > 移动开发 > 详细

Linux三剑客学习之提取手机号码

时间:2015-12-17 16:21:28      阅读:285      评论:0      收藏:0      [点我收藏+]

标签:shell 三剑客 grep sed awk

【问题描述】

会员提供的信息中,有些手机号是会员随意输入的,因此要统计出有效的手机号。

如以下信息:

18295089368
1895089368
185089368
182089368
17888888888
17884432254
17888132435
17812266688
18295089368
18235089368
13335508387
15575089368

【解决办法】

利用grep,sed与awk结合正则即可。下面分别说明这三个的用法。

1.grep

root@network test$egrep ‘^1[3578][0-9]{9}‘ test.txt 
18295089368
17888888888
18295089368
18235089368
13335508387
15575089368
root@network test$grep -oP ‘(?<=‘‘)(1[3578]{1}[0-9]{9})(?=‘‘)‘ test.txt
18295089368
17888888888
18295089368
18235089368
13335508387
15575089368

2.sed

root@network test$sed -n ‘/1[3578]\{1\}[0-9]\{9\}/p‘ test.txt
18295089368
17888888888
18295089368
18235089368
13335508387
15575089368
root@network test$sed -rn ‘/1[3578]{1}[0-9]{9}/p‘ test.txt
18295089368
17888888888
18295089368
18235089368
13335508387
15575089368

3.awk

root@oldboy test$awk --posix ‘/1[3578]{1}[0-9]{9}/‘ test.txt
18295089368
17888888888
18295089368
18235089368
13335508387
15575089368

注;以上的awk中的--posix启用后就支持间隔表达式了,即r{n},r{n,},r{n,m}

然后说一下个性化需求。

1.如查找含有连续两个8的手机号。

root@network test$grep -E ‘1[3578]{1}.*[8]{2}.*‘ test.txt 
17888888888
17884432254
17888132435
17812266688

root@network test$sed -rn ‘/1[3578]{1}.*[8]{2}.*/p‘ test.txt
17888888888
17884432254
17888132435
17812266688

root@network test$awk --posix ‘/1[3578]{1}.*[8]{2}.*/‘ test.txt
17888888888
17884432254
17888132435
17812266688

2.查找末尾是两个8的手机号

root@network test$grep -E ‘1[3578]{1}[0-9]{7}[8]{2}‘ test.txt 
17888888888
17812266688

root@network test$sed -rn ‘/1[3578]{1}[0-9]{7}[8]{2}/p‘ test.txt
17888888888
17812266688

root@network test$awk --posix ‘/1[3578]{1}[0-9]{7}[8]{2}/‘ test.txt
17888888888
17812266688


Linux三剑客学习之提取手机号码

标签:shell 三剑客 grep sed awk

原文地址:http://xoyabc.blog.51cto.com/7401264/1725659

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!