标签:cut linux style 重复 any 相同 grep -E 包含 序列
正则表达式 grep cut sort uniq
正则表达式是一种表示方式, 让你可以查找匹配特定准则的文本。
. 匹配任何单个的字符,但是null除外
* 匹配在它之前的任何数目的单个字符
.* 代表 匹配任一字符的任一长度
^ 匹配前面的正则表达式 ,在字符串或者行的起始处
$ 匹配前面的正则表达式,在字符串或行的结束处
[] 匹配方括号内的任一字符 ^符号置于方括号里第一个字符则有相反含义:指的是匹配不在列表内的任一字符
\{n,m\} 区间表达式,匹配在它前面的单个字符重现的次数区间。\{n\}是重现n次 ,\{n,\}至少重现n次,而\{n,m\}为重现n至m次
\(\) 将\(与\)间的模式存储在特殊的保留空间。最后可以将9个独立的子模式存储在单个模式中。匹配于子模式的文本,可以通过转义序列\1至\9,被重复使用在相同模式里。
\n 重复在\(\与)方括号内第n个子模式至此点的模式。
{n,m} 与\{n,m\}一样,用在扩展的正则表达式中 ,只不过方括号前没有反斜杠
+ 匹配前面正则表达式的一个或多个实例 用在扩展的正则表达式中
? 匹配前面正则表达式的0个或1个实例 用在扩展的正则表达式中
| 匹配于| 符号前或后的正则表达式 用在扩展的正则表达式中
() 匹配于方括号扩起来的正则表达式群 用在扩展的正则表达式中
字符集:
[:alnum:] 数字字符
[:alpha:] 字母字符
[:blank:] 空格与定位字符
[:digit;] 数字字符
[:lower:] 小写字母字符
[:punct:] 标点符号字符
[:space:] 空白字符
[:upper:] 大写字母字符
Grep 查找 全文搜索正则表达式并打印出来,从文件中匹配整个模式,而后显示包含了匹配到得内容的行
Grep -v 反向显示
grep -n 在匹配到得结果中只显示输入的行数
grep -i 忽略大小写
grep -e 可以查找多个内容
grep -An 匹配到得行的后面的n行
grep -Bn 匹配到得行的前面的n行
grep -Cn 上下n行
grep -E 使用扩展正则表达式进行匹配
Cut 以段和列取内容
Cut -d: 以冒号隔开
Cut -f1 第一行
Cut -c2-6 第2-6个字符
Sort 排序 (对源文件没有影响,想保存用管道或sort -o 文件名)
Sort 默认以字符串排序
Sort -r 逆序
Sort -n 以数值来排序
Sort -f 忽略大小写
Sort -u 排序之后除去重复的行
Uniq 去除重复的行
Uniq -c 可以显示每行被重复的次数
Uniq -u 只显示不重复的行
Uniq -d 只显示重复的行
Sed 行编辑器
Sed -s 只替换源文件的第一个 加g 为每次都替换
Sed 起始位置 结束位置 / / g
Sed -i 替换源文件
Sed -e 同时实现多项应用条件
Sed -f 从文件中读取条件的选项
Sed -i 忽略大小写
Sed a\ 在当前行之前插入文本
Sed -d 删除行 i\在当前行之前插入文本
标签:cut linux style 重复 any 相同 grep -E 包含 序列
原文地址:http://blog.51cto.com/lwm666/2145211