主要是学习re模块的使用,正则表达式的学习...我都看了,就是运用少,所以没记住什么,用到的时候,还得翻我手工记录的正则笔记.....如果是爬取网页,可以用bs4模块,这个更方便,只是正则很强大(~ ̄▽ ̄)~ 看的下面这个文章做得笔记 https://mp.weixin.qq.com/s?__biz ...
分类:
编程语言 时间:
2018-01-18 23:02:30
阅读次数:
215
1.1介绍通过过滤和分析HTML代码,实现对文件、图片等资源的获取,一般用到:urllib和urllib2模块正则表达式(re模块)requests模块Scrapy框架urllib库:1)获取web页面2)在远程http服务器上验证3)表单提交(GET和POST)4)异常处理(urllib2.URLError)5)非http协议通信(ftp)获取页面信息:urllib2.urlopen(url,d
分类:
编程语言 时间:
2018-01-17 00:37:36
阅读次数:
223
正则表达式 正则表达式,又称规则表达式,通常被用来检索、替换那些符合某个模式(规则)的文本。 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。 给定一个正则表达式和另一个字符串,我 ...
分类:
其他好文 时间:
2018-01-16 18:32:39
阅读次数:
194
1. 使用re.compile re模块中包含一个重要函数是compile(pattern [, flags]) ,该函数根据包含的正则表达式的字符串创建模式对象。可以实现更有效率的匹配。在直接使用字符串表示的正则表达式进行search,match和findall操作时,python会将字符串转换为 ...
分类:
编程语言 时间:
2018-01-13 23:46:01
阅读次数:
195
正则表达式本身是一种小型的、高度专业化的编程语言,而在python中,通过内嵌集成re模块,码农们可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行。 match 匹配字符串的开头 fullmatch Match a regular expression ...
分类:
其他好文 时间:
2018-01-13 20:59:56
阅读次数:
154
re模块(正则表达式) 一、什么是正则表达式 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。或者说:正则就是用来描述一类事物的规则。(在Python中)它内嵌在Python中,并通过 re 模块实现。正则表达式模式被编译成一系列的字节码,然后由用 C 编写的 ...
分类:
其他好文 时间:
2018-01-13 16:54:15
阅读次数:
159
1.1 介绍通过过滤和分析HTML代码,实现对文件、图片等资源的获取一般用到:urllib和urllib2模块正则表达式(re模块)requests模块Scrapy框架urllib库:1)获取web页面2)在远程http服务器上验证3)表单提交(GET和POST)4)异常处理(urllib2.URLError)5)非http协议通信(ftp)获取页面信息:urllib2.urlopen(url,d
分类:
编程语言 时间:
2018-01-12 22:38:08
阅读次数:
264
正如python的re模块,不过Java和Python的正则表达式有一些区别,这里做简单介绍,具体的细节可以参考网上其他的文章: 功能:可以用于检验一个字符串,比如验证用户名,验证密码格式,验证是否是邮箱,等等 示例: "[0-9]{6,12}"匹配规则:6到12位的数字,比如123456789就是 ...
分类:
编程语言 时间:
2018-01-11 15:46:43
阅读次数:
205
一、前面简单写了一下re模块操作字符串的写法,加上正则之后 re模块才能发挥更强大的功能。 先看看常见的正则符号: 复习一下基础的re模块: 二、正则常用 ...
分类:
编程语言 时间:
2018-01-10 13:52:02
阅读次数:
178