码迷,mamicode.com
首页 > 其他好文 > 详细

文本处理三剑客,正则表达式等

时间:2018-03-25 22:19:14      阅读:169      评论:0      收藏:0      [点我收藏+]

标签:正则

文本处理:

            grep:文本过滤:
            sed:流编辑器;
            awk:linux上实现gawk,文本报告生成器(格式化文本):

            正则表达式:regular expression

                    基本正则:
                    扩展正则:

            grep:

                        grep "UUID" /etc/fstab
                                    --color :配置到的行高亮显示;
                                    -i:忽略字符大小去匹配;
                                    -o:仅显示匹配到的字符本身;
                                    -v:显示不能被匹配的行;
                                    -B 2,-A 3:匹配到的行的前几行或者后几行
                                    -C 2,前后各2行;

                        基本正则表达式元字符:

                                字符匹配: .号匹配任意单个字符 grep "r..t" /etc/passwd
                                                                            []:匹配指定范围内的任意单个字符
                                                                            [^]:匹配指定范围外的任意单个字符
                                                                            [[:diglt:]] ,[[:lower:]]等等                              

                                匹配次数:用于指定其出现的次数的
                                                                        *:x*y ,则可以匹配xxxx,yyyyy,xxxxyy,都可以匹配
                                                                        .*:匹配任意长度的任意字符;
                                                                        \?:匹配其前面的字符0次或1次;即其前面的字符是可有可无
                                                                        \+:匹配其前面的字符出现1次或多次;
                                                                        \{\m}:匹配其前面的字符m次;

                                                                        后面还有很多,例如次数范围内的匹配

                            位置锚定:
                                                                    ^:行首锚定,用于模式的最左侧;
                                                                    grep "^root" /etc/passwd
                                                                    $:行尾锚定,用于模式的最右侧;
                                                                    ^&:空白行
                                                                    ^[[:space:]]$:空白行或者包含空白字符的行

                            分组及引用:

                                                                    grep "\(l..e\).*\1" /lover.txt

                                                                    引用前面的分组括号中的模式所匹配到的字符

文本处理三剑客,正则表达式等

标签:正则

原文地址:http://blog.51cto.com/6380289/2090974

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!