码迷,mamicode.com
首页 >  
搜索关键字:文本处理    ( 1321个结果
python文件操作
日常操作中,少不了文本处理,如程序输入数据准备,python凭借其简洁优雅的语法,在文本处理上比C++等编译型语言开发效率高出一大截。文件操作示例#输入文件f = open(r'D:\Python27\pro\123.bak')#输出文件fw = open(r'D:\Python27\pro\123...
分类:编程语言   时间:2015-08-31 17:01:27    阅读次数:191
正则表达式
一、Linux文本处理三剑客:grep:文本过滤工具;sed:文本编辑器(行);streameditorawk:文本报告生成器;Linux上awk的实现为gawkgrep:GlobalsearchREgularexpressionandPrintouttheline.作用:文本搜索工具,根据用户指定的“模式(pattern)”逐行去搜索目标文本,打印匹配到的..
分类:其他好文   时间:2015-08-30 17:55:43    阅读次数:207
linux grep学习整理
第一部分:补充umask遮罩码目录权限为777-umask用户为666-umask如果某一类用户的权限有执行权限,会自动加1管理员的遮罩码为0022普通用户的为0002第二部分:文本处理工具1、定义:Linux文件三个本地处理工具A:grep文本过滤工具,搜索工具B:sed文件编辑工具C:awk文本报告生成..
分类:系统相关   时间:2015-08-30 08:49:30    阅读次数:264
grep和正则表达式
正则表达式:是一套处理字符串的规则和方法。以行为单位对字符串进行处理。可以快速过滤替换某些特定字符串。 linux下文本处理的三剑客: awksedgrep(egrep) grepgrep为globalsearchregularexpression(RE)andprintouttheline的缩写,即根据用户指定的文本搜索模式对目标文件进..
分类:其他好文   时间:2015-08-30 01:16:33    阅读次数:158
Linux学习之路-grep和正则表达式的应用
grep和正则表达式的应用Linux文本处理三剑客:grep:文本过滤工具;sed:文本编辑器(行);streameditorawk:文本报告生成器;Linux上awk的实现为gawkgrep:GlobalsearchREgularexpressionandPrintouttheline.作用:文本搜索工具,根据用户指定的“模式(pattern)”逐行去搜索目标..
分类:系统相关   时间:2015-08-29 17:14:43    阅读次数:267
grep使用正则表达式
1、总结本此课程中所涉及命令的使用方法及相关示例展示;命令:权限管理:权限管理:chmod所属关系管理:chown,chgrp文件遮罩码:umaskLinux文本处理三剑客:grep:文本过滤工具;sed:文本编辑器(行);streameditorawk:文本报告生成器;Linux上awk的实现为gawkgrep作用:文本搜..
分类:其他好文   时间:2015-08-28 21:47:09    阅读次数:417
awk 正则表达式、正则运算符详细介绍(转)
前言:使用awk作为文本处理工具,正则表达式是少不了的。 要掌握这个工具的正则表达式使用。其实,我们不必单独去学习它的正则表达式。正则表达式就像一门程序语言,有自己语法规则已经表示意思。 对于不同工具,其实大部分表示意思相同的。在linux众多文本处理工具(awk,sed,grep,perl)里面用...
分类:其他好文   时间:2015-08-28 10:54:24    阅读次数:169
文本处理命令:cut,sort,wc,uniq
文本处理命令:cut,sort,wc,uniqcut选取一段信息中的某一段,处理的信息以“行”为单位。语法:cutOPTION...[FILE]...参数:–d‘分割符’–f#按字符分割,显示第#段#,#,#:1,3,5显示第1,3,5段信息#-#:2-4显示第2到第四段信息–c#以字符的单位取出固定字符区间多用于?.
分类:其他好文   时间:2015-08-27 08:20:20    阅读次数:144
斯坦福大学自然语言处理第二课“文本处理基础(Basic Text Processing)”
文本处理基础1.正则表达式(Regular Expressions)正则表达式是重要的文本预处理工具。 以下截取了部分正则写法: 2.分词(Word tokenization) 我们在进行每一次文本处理时都要对文本进行统一标准化(text normalization)处理。文本规模 How many words? 我们引入变量Type和Token 分别代表词典中的元素(an...
分类:编程语言   时间:2015-08-26 20:14:22    阅读次数:196
Linux学习日记--基础命令(4)--文本处理,重定向,管道
打开的文件都有一个fd:filedescriptor(文件描述符)标准输入:keyborad,0标准输出:monitor,1标准错误输出:monitor,2I/O重定向:改变标准位置输出重定向:COMMAND>NEW_POS,COMMAND>>NEW_POS>:覆盖重定向,目标文件中的原有内容会被清除;>>:追加重定向,新..
分类:系统相关   时间:2015-08-26 07:13:19    阅读次数:242
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!