文本处理三剑客(grep)grep:文本过滤(模式:pattern)工具grep,egrep,fgrep(不支持正则表达式搜索)作用:文本搜索工具,根据用户指定的“模式”对目标文本逐行进行匹配检查;打印匹配到的行模式:由正则表达式字符及文本字符所编写的过滤条件grep命令选项-color=auto:对匹配到的文本着色显示-m#匹配#次后停止-v显示不被pattern匹配到的行-I忽略字符大小写-n
分类:
其他好文 时间:
2019-03-16 15:34:56
阅读次数:
168
我们写一个爬虫, 主要还是要提取网页中的文本信息, 而正则表达式可以很容易的完成这一任务, 这节, 我们来学习一些基本的正则表达式用法, 在以后的章节中, 会在适当的时候插入一些高级用法。 在python中, 使用正则表达式需要引入re包 1. 匹配普通字符. 任何数字, 字母, 标点符号等, 都可 ...
分类:
其他好文 时间:
2019-03-15 01:05:02
阅读次数:
203
grep,egrep,fgrep grep:根据模式搜索文本,并将符合模式的文本行显示出来 grep [OPTIONS] PATTERN [FILE...] -i:忽略大小写 --color:以高亮颜色显示 -v:显示没有被模式匹配的行 -o:只显示被匹配到的字符串 -E:使用扩展正则表达式 -A ...
分类:
系统相关 时间:
2019-03-13 13:45:36
阅读次数:
206
题目描述: 如果给定的字符串是回文,返回true,反之,返回false。如果一个字符串忽略标点符号、大小写和空格,正着读和反着读一模一样,那么这个字符串就是palindrome(回文)。注意你需要去掉字符串多余的标点符号和空格,然后把字符串转化成小写来验证此字符串是否为回文。函数参数的值可以为"ra ...
分类:
编程语言 时间:
2019-03-12 12:22:38
阅读次数:
213
概述 正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式描述了一种字符串匹配的模式,通常被用来检索、替换那些符合某个模式(规则)的文本。 语法 列目录时,dir *.txt或ls *.txt中的 ...
分类:
其他好文 时间:
2019-03-11 13:23:08
阅读次数:
176
在字体设置中,已经设置西文字体为“(使用中文字体)”,结果office 2013还是自动将输入的英文符号自动变成calibri字体。 举例:输入以下一段话 好好学习,天天向上。 中文字体中后面跟着标点符号,这个时候word 2013就自作聪明的将标点符号变成calibri字体,非常不方便,还需要手工 ...
分类:
其他好文 时间:
2019-03-05 09:20:15
阅读次数:
1177
bash基础特性 globbing:文件名通配(整体文件名匹配,而非部分) 匹配模式:元字符 *:匹配任意长度的任意字符 ?:匹配任意单个字符 []:匹配指定范围内的任意单个字符 特殊格式:[a-z],[A-Z],[0-9],[a-z0-9],[abcd] [[:upper:]]:所有大写字母 [[ ...
分类:
其他好文 时间:
2019-03-03 09:16:20
阅读次数:
203
出现问题一: 问题描述:输入自己在路由配置的地址,跳转失败总是回到登入界面 问题分析: 1.是否清理缓存 清理缓存后发现问题依旧 2.是否路由地址配置错误 仔细检查路由配置,看看是否疏忽了大小写和;;漏了标点符号,发现没有 3.是否把route-config-xxxx加入到route-config ...
分类:
其他好文 时间:
2019-02-26 13:37:42
阅读次数:
149
ASCII ASCII码是7位编码,编码范围是0x00-0x7F。ASCII字符集包括英文字母、阿拉伯数字和标点符号等字符。其中0x00-0x20和0x7F共33个控制字符。只支持ASCII码的系统会忽略每个字节的最高位,只认为低7位是有效位。HZ字符编码就是早期为了在只支持7位ASCII系统中传输 ...
分类:
其他好文 时间:
2019-02-22 01:07:14
阅读次数:
293