码迷,mamicode.com
首页 >  
搜索关键字:文本处理    ( 1321个结果
1.Perl基础系列之WHAT、WHY、HOW
What? Perl,一种功能丰富的计算机程序语言,运行在超过100种计算机平台上,适用广泛,从大型机到便携设备,从快速原型创建到大规模可扩展开发。 Why? Perl追求简洁快速地解决问题,可很方便地进行文本处理、工具整合等操作,因此被广泛应用在自然语言处理领域,语音识别的很多开源工具,如HTK、...
分类:其他好文   时间:2015-11-14 15:02:56    阅读次数:254
Linux文本处理三剑客之awk
已经讲了grep、sed,那么今天我们就开始最后一个awk的讲解
分类:系统相关   时间:2015-11-10 14:17:14    阅读次数:194
Linux文本处理三剑客之sed
今天我们来讲解三剑客之中的sed命令
分类:系统相关   时间:2015-11-10 01:46:50    阅读次数:185
文本处理命令系列——head和tail
head:查看文件的内容,默认显示的是前10行内容。tail:查看文件的内容,默认显示的是后10行内容。head和tail如果想显示指定行数的内容,可以用-n选项。选项说明: head-nnumber:显示前number行的内容。 head-cnumber-bytes:显示前面多少个字节的内容。可以使用K等单位。如he..
分类:其他好文   时间:2015-11-09 19:22:17    阅读次数:178
文本处理命令系列——cut
cut常用选项: -b:选择指定的字节。 -d:指定字段分隔符,默认为TAB -f:指定要选择的字段。格式如下: N:第N个字段 N-M:N到M个字段 N-:从第N个字段到最后。 -M:从第一个字段到第M个字段。示例:使用冒号为分隔符,获取文件/etc/passwd的第一个字段 [root@vm1~]#head-n2/..
分类:其他好文   时间:2015-11-09 19:20:19    阅读次数:176
文本处理命令系列——uniq
uniq的作用:显示重复或忽略重复的行。等同于sort-u常用选项: -d:只显示重复的行。 -c:每一行出现的次数。 -u:只显示没有重复的行 -i:忽略大小写。示例:显示每一个用户登录的次数 [root@vm1~]#last|cut-d‘‘-f1|grep-v‘^$‘|sort|uniq-c 26reboot 74root 1wtmp [root@vm1~]#
分类:其他好文   时间:2015-11-09 19:19:42    阅读次数:168
文本处理命令——grep
grep的作用是打印匹配模式的行,只要包含匹配模式的行都打印出来。语法格式:grep[OPTIONS]PATTERN[FILE...] 说明:pattern是由文本字符和正则表达式的元字符组合而成的匹配条件。常用的选项:-i:忽略大小写。-v:反向选择,打印不匹配的行。--color=always|never|auto:使用..
分类:其他好文   时间:2015-11-09 19:19:17    阅读次数:318
文本处理命令系列——grep的扩展用法
正则表达式分为基本的正则表达式和扩展的正则表达式。通常情况下,grep使用的是基本的正则表达式,如果要使用扩展的正则表达式,可以用-E选项,等同于egrepgrep的其他一些选项:-An:显示匹配行后面的n行,(after)。-Bn:显示匹配行前面的n行,(before)。-Cn:显示前后各n..
分类:其他好文   时间:2015-11-09 19:15:48    阅读次数:201
grep命令及正则表达式的使用和介绍
grep是Linux系统中的一个文本流处理工具,用于在文件中搜寻所需要的内容。grep、awk、sed被称为文本处理三剑客。接下来我们看一下grep的使用格式及常用选项:grep[options]PATTERN[FILE...] -v#过滤匹配到的行 -o#仅显示匹配到的字符 -i#匹配字符时候忽略大小写 -n#显示行号 -A..
分类:其他好文   时间:2015-11-09 19:06:48    阅读次数:238
[Ruby]使用Ruby抓取网页及加工处理
并不是专业做网页抓取的爬虫的,只是之前在一个做的挺烂的网站上帮人刷票起步逐渐学习了网页抓取的工具。最初的时候是用Python的urllib2,拿到网页当文本处理,后来才在论坛上看到有BeautifulSoap这种级别的神器,Python处理起这种来实在是方便,可惜后来我遇到了Ruby及Rails,从...
分类:Web程序   时间:2015-11-06 18:04:18    阅读次数:231
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!