cut命令
作用
cut命令主要用于裁剪文本每行中的数据
主要参数:
-b :以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。
-c :以字符为单位进行分割。
-d :自定义分隔符,默认为制表符。
-f :与-d一起使用,指定显示哪个区域。
-n :取消分割多字节字符。仅和 -b 标志一起使用。如果字符的最后一个字节落在由 -b 标志的 List 参数指示的范围之内,该字符将被写出;否则,该字符将被排除。
-s表示不包括那些不含分隔符的行,只切割和显示匹配的字符
-c和-f参数可以跟以下子参数:
m第m个字符或字段
m-从第m个字符或字段到文件结束
m-n从第m个到第n个字符或字段
-n从第1个到第n个字符或字段
事例
三种定位方法:
以字节定位-b
[jeck@localhost ~]$ cat test
aa aa
bb aa
cc aa
dd AA
[jeck@localhost ~]$ cut -b 1 test
a
b
c
d
以字符定位-c
[jeck@localhost ~]$ cat test
星期一
星期二
星期三
星期四
[jeck@localhost ~]$ cut -b 3 test
?
?
?
?
[jeck@localhost ~]$ cut -c 3 test
一
二
三
四
-c处理的是一个字符,而-b处理的是一个字节。所以。当出现汉字时,使用-b就会乱码,可以加-n,使不拆分字节
以域定位 -f -d
[jeck@localhost ~]$ cat test
a:b:c
1:2:3
aa:11:bb
dd:nn:mm
[jeck@localhost ~]$ cut -d : -f 2 test
b
2
11
nn
[root@localhost tmp]# cut -d : -f1,2 test
a:b
1:2
aa:11
dd:nn
[root@localhost tmp]# cut -d : -f1-3 test
a:b:c
1:2:3
aa:11:bb
dd:nn:mm
-s 用法
[root@localhost tmp]# cat test
a:b:c
1:2:3
aa:11:bb
dd:nn:mm
vv-aa-22
dd-44-55
[root@localhost tmp]# cut -d : -f1 test 下面两行不匹配,会全部打印
a
1
aa
dd
vv-aa-22
dd-44-55
[root@localhost tmp]# cut -d : -f1 -s test 加-s之后,只切割匹配的
a
1
aa
dd
--output-delimiter指定打印的分隔符
[root@localhost tmp]# cut -d : -f1,3 -s --output-delimiter="****" test
a****c
1****3
aa****bb
dd****mm
区分空格和制表符
使用sort -n l 即可
[jeck@localhost ~]$ cat test1
aa bb
11 22
[jeck@localhost ~]$ sed -n l test1
aa bb$
11\t22$
如果是制表符(TAB),那么会显示为\t符号,如果是空格,就会原样显示