正则表达式(REGULAR):为处理大量的字符串而定义的一套规则和方法,为了处理大量字符串而生 常见命令参数 基础正则表达式. :有且只有任意一个字符(包括空格) * :重复前面任意0或者多个字符 .*:匹配任意字符==>所有,包括空格 \ :转义字符,让有意义的字符,显示原型 \$ --> $本身... ...
分类:
系统相关 时间:
2018-07-07 22:40:17
阅读次数:
215
如果你想匹配的是字面字符串,那么你通常只需要调用基本字符串方法就行, 比如 str.find() , str.endswith() , str.startswith() 或者类似的方法。对于复杂的匹配需要使用正则表达式和 re 模块,如果你想使用同一个模式去做多次匹配,你应该先将模式字符串预编译为模式对象。match() 总是从字符串开始去匹配,如果你想查找字符串任意部分的模式出现位置, 使用 findall() 方法去代替
分类:
编程语言 时间:
2018-06-14 18:14:14
阅读次数:
176
一、正则表达式 RE regular expression 1、什么是正则 为何用它? 你可以通过什么方法选出这里面的身份证号码。 440304199604012792 130528197108126121 3605sss98304033896 342923198310042132 1404dddd ...
分类:
系统相关 时间:
2018-06-06 10:49:50
阅读次数:
201
Linux正则表达式1、组成普通字符:普通字符串,没有特殊含义特殊字符:在正则表达式中具有特殊的含义正则表达式中常见的meta字符【特殊字符】2、POSIXBRE【基本】与ERE【扩展】中都有的meta字符\:通常用于打开或关闭后续字符的特殊含义,如(...)【\是转义字符,去掉符号的特殊意义,()、{}等在shell中都有特殊的意义】.和以及.的区别:[root@localhost~]#cat-
分类:
系统相关 时间:
2018-05-16 10:55:40
阅读次数:
247
一,URLconf配置 1,基本格式 2,参数说明 正则表达式:一个正则表达式字符串 views视图函数:一个可调用对象,通常为一个视图函数或一个指定视图函数路径的字符串 参数:可选的要传递给视图函数的默认参数(字典形式) 别名:一个可选的name参数 二,正则表达式详解 1,基本配置 2,注意事项 ...
分类:
其他好文 时间:
2018-03-30 20:01:28
阅读次数:
181
python正则表达式详解 python正则表达式详解 正则表达式是一个很强大的字符串处理工具,几乎任何关于字符串的操作都可以使用正则表达式来完成,作为一个爬虫工作者,每天和字符串打交道,正则表达式更是不可或缺的技能,正则表达式的在不同的语言中使用方式可能不一样,不过只要学会了任意一门语言的正则表达 ...
分类:
编程语言 时间:
2018-01-24 22:05:05
阅读次数:
148
本篇导航: 介绍 基本使用 遍历文档树 搜索文档树 总结 re模块在之前的python进阶中有讲过不再做过多的阐述,本篇为BeautifulSoup库的分析 20、collections模块和re模块(正则表达式详解) 一、介绍 Beautiful Soup 是一个可以从HTML或XML文件中提取数 ...
分类:
其他好文 时间:
2018-01-19 16:52:30
阅读次数:
226
文本处理工具:全屏编辑器:vim,nano行编辑器:文本处理三剑客:grep系列,sed,awkgrep系列:grep,egrep,fgrep;统称为文件搜索工具;基于PATTERN(模式)对于给定的文本文件进行模糊搜索,grep系列所有命令默认个左右贪婪工作模式;sed:streameditor,流编辑器,文本编辑工..
分类:
其他好文 时间:
2017-11-16 17:21:33
阅读次数:
164
一、导读 正则表达式,又称规则表达式。(英文名Regular Expression,所以代码中常以regex、regexp、RE表示)。正则表达式简单说就是用于操作文本数据的规则表达式,在Java中我们使用正则表达式来对字符串进行“有规则的操作”,没理解没关系,看下面的练习就懂了。 正则表达式对字符 ...
分类:
编程语言 时间:
2017-10-27 23:48:15
阅读次数:
329
以下是‘’网络爬虫‘’课程(中国MOOC)学习笔记 【万能的b站】 核心思想: The Website is the API 课程大纲: 一、Requests与robots.txt 1.Requeests 自动爬取HTML页面,自动网络请求提交 2.robots.txt 网络爬虫排除标准 二、Bea ...
分类:
编程语言 时间:
2017-09-27 10:05:15
阅读次数:
164