1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语 ...
分类:
其他好文 时间:
2017-10-02 17:19:02
阅读次数:
224
1、正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 re 模块使 Python 语言拥有全部的正则表达式功能。 re.match函数 re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。 结 ...
分类:
编程语言 时间:
2017-09-30 20:03:11
阅读次数:
215
前言: 什么是正则表达式? 正则表达式(Regular expressions 也称为 REs,或 regexes 或 regex patterns)本质上是一个微小的且高度专业化的编程语言。 正则表达式并不是Python的一部分。它被嵌入到 Python 中,并通过 re 模块提供给程序猿使用。使 ...
分类:
编程语言 时间:
2017-09-28 19:11:57
阅读次数:
199
写在前面:第一次使用爬虫,甚至都算不上爬虫,水平有限,主要作为学习记录。 主要业务流程如下: 使用python的requests模块获取页面信息 通过re模块(正则表达式)取出需要的内容(小说标题,正文) 通过MysqlDB模块入库 使用webpy模块进行访问 下面是效果图,简单实现了点击上一页、下 ...
分类:
编程语言 时间:
2017-09-27 22:31:16
阅读次数:
202
re模块 1、正则表达式的语法 '.' 匹配任意字符,若指定了re.S,则可以匹配换行符'^' 匹配行首,即字符串的开头,若指定了re.M,会自动匹配每行开头'$' 匹配行尾,同上'*' 匹配大于等于0个的re'+' 匹配大于等于1个的re'?' 匹配0个或1个的re,此外?是非贪婪匹配的标志{m} ...
分类:
编程语言 时间:
2017-09-24 21:25:23
阅读次数:
289
正则表达式为高级的文本模式匹配、抽取、与/或文本形式的搜索和替换功能提供了基础。通过标准库中的re模块来支持正则表达式。 常见的正则表达式符号和特殊字符 匹配x-y范围内的任意单一字符 \w 如果问号紧跟在任何使用闭合操作符的匹配后面,它将直接要求正则表达式引擎匹配尽可能少的次数。 尽可能少的次数是 ...
分类:
编程语言 时间:
2017-09-19 00:32:17
阅读次数:
234
python正则表达式re模块 打文本中搜索某个字段 python有个库 re import re 正则表达式 . 点表示任意的字符 [a-z] 这个位置一定是个小写a到z的字母 print(lent(result)) 打文本中搜索某个字段 python有个库 re import re 正则表达式 ...
分类:
编程语言 时间:
2017-09-15 01:45:37
阅读次数:
253
正则表达式并不是python中的一部分,正则表达式适用于处理字符串的强大工具,拥有自己独特的语法,以及独立的处理引擎.在提供了正则表达式的语言中都它的语法是都一样的 re模块本质上和正则表达式没有一毛钱的关系,re模块是python提供给我们方便操作正则的工具而已 正则表达式概念 字符组等于 [ ] ...
分类:
编程语言 时间:
2017-09-13 21:20:23
阅读次数:
165
一 正则表达式和re模块 1 什么叫做正则表达式:这则表达式是字符串的一种筛选规则 2 正则表达式的好处:1,1匹配:检测字符串是否符合正则表达式的规则,否则返回False。 1,2 切割:按照一定的规则将字符串分割成多个字符串。 1,3替换:将字符串中的字符替换成指定的字符。 1,4获取:获取与规 ...
分类:
其他好文 时间:
2017-09-13 20:18:31
阅读次数:
128
实验需要,在一个含有几亿个字符的txt文件中查找特定的字符串,首先用re模块进行查找 re.finditer(filename, label_str)可以在label_str中查找filename的位置,s=match.start()返回字符串开始的索引,e=match.end(),返回字符串结束的 ...
分类:
编程语言 时间:
2017-09-12 13:54:54
阅读次数:
214