码迷,mamicode.com
首页 > 系统相关 > 详细

Linux学习总结(十八)几个简单的文本处理工具cut sort tr split

时间:2018-03-04 14:45:54      阅读:196      评论:0      收藏:0      [点我收藏+]

标签:cut   sort   tr   tee   uniq   

1 命令cut

用来截取某一个字段
格式 : cut -d ‘分隔符‘ [-cf] n, n为数字,表示第几段
-d:后面跟分隔符,分割符要加单引号
-c:后面接的是第几个字符
-f:后面接的是第几段
那么意思是-c,-f选项二选一
例如: head -3 /etc/passwd |cut -d ‘:‘ -f 1
技术分享图片
例如 head -3 /etc/passwd |cut -c 1
技术分享图片
-c也可以是一个区间
例如 head -3 /etc/passwd |cut -c1-3
技术分享图片
-c 也可以单独指定好几个位置的字符
例如 head -3 /etc/passwd |cut -c1,3,4
技术分享图片

2 命令sort

用来排序,格式为 sort [-t 分隔符] [-kn1,n2] [-nru],这里n1和n2为数字
-t:后面跟分割符,作用跟cut的-d一样
-n:表示用纯数字排序
-r:表示反向排序
-u:表示去重复
-kn1,n2:表示由n1区间排序到n2区间,可以只写-kn1,即对n1字段排序
sort 不加任何选项表示从首字符向后依次按ASCII码值进行比较,最后按升序输出
例如 head -4 /etc/passwd |sort
技术分享图片
-t 指定分隔符,-k指定区域
例如 head -4 /etc/passwd |sort -t ‘:‘ -k3 -n
技术分享图片
也可以对连续一段区域排序
例如 head -4 /etc/passwd |sort -t ‘:‘ -k3,5 -r
技术分享图片

3 命令wc

用于统计文档的行数,字符数或词数
-l 统计行数
-m 统计字符数
-w 统计词数
技术分享图片

4 命令uniq

用来删除重复的行,前提是需要排序
-c 用来统计重复的行数
我们编写一个test.txt来理解下
技术分享图片

5 命令tee

tee 配合管道符使用作用类似于重定向,但比重定向多一个功能,可以把文件写入目标文件时,还可以把它打印出来。
比较下这两句: head -3 /etc/passwd > a.txt
head -3 /etc/passwd |tee b.txt
技术分享图片

6 命令 tr

用于替换字符,常用来处理文档中的特殊符号
-d 表示删除某个字符
-s 表示删除重复的字符
举两个例子 ,小写替换大写
head -2 /etc/passwd |tr ‘[a-z]‘ ‘[A-Z]‘
技术分享图片
替换某一个字符
head -2 /etc/passwd |tr ‘o‘ ‘O‘
技术分享图片

7 命令split

用户切割文档,常用的选项有-b,-l
-b :指定文件大小切割,单位为byte
例如我们把一个3M的文件切割3份
技术分享图片
下面我们按行切割下,/etc/passwd 有21行,我们把它按行切割为三份
技术分享图片

Linux学习总结(十八)几个简单的文本处理工具cut sort tr split

标签:cut   sort   tr   tee   uniq   

原文地址:http://blog.51cto.com/12606610/2082766

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!