写这个程序是因为校园网公告栏时不时会有学术报告,讲座之类的信息发布,但这类信息往往发布在讲座的前一天,以至于丢失很多重要消息。同时公告栏里也会发布一些跟学生无关的内容,比如工会主席会议啥的。 主要遇到的困难时对中文的正则匹配问题。(比如通过第一次正则可以提取到一个页面内的所有中文标题,第二次正则从这 ...
分类:
编程语言 时间:
2016-06-04 23:39:30
阅读次数:
618
--首先,感谢黑板客老师做了这个爬虫闯关系列,让大家学习到不少知识。 第一关:将网页提示的数字加在网址后面 解题思路: 1、找到数字对应的html标签,用正则匹配标签内容。 2、将数字提取出来加到第一关网址后面,获取新的数字。 解题过程: 第二关: 解题思路:从0~30依次尝试登录。 第三关:在第二 ...
分类:
其他好文 时间:
2016-06-04 22:10:31
阅读次数:
371
例: 匹配<a href="Request?&dse_sessionId=9qznb8P7TyQjSjLtgwiD4li&dse_applicationId=-1&dse_pageId=2&dse_operationName=displayPageNotLoginOp&dse_errorPage=i ...
分类:
其他好文 时间:
2016-06-04 16:10:16
阅读次数:
175
安装pcrevarnish 依赖pcre进行url正则匹配。 cd pcre-8.12./configure --prefix=/usr/local/make&&make install 编译解压缩varnish源码包 wget http://repo.varnish-cache.org/sourc ...
分类:
其他好文 时间:
2016-06-03 17:22:45
阅读次数:
162
/*此处用于验证手机*/ $phone_preg = '/^1[3|4|5|7|8]\d{9}$/'; $email_preg = '/^[a-zA-Z0-9_]+([.][a-zA-Z0-9_]+)*[@][a-zA-Z0-9_]+([.][a-zA-Z0-9_]+)*[.][a-zA-Z]{2, ...
分类:
移动开发 时间:
2016-06-02 18:06:59
阅读次数:
166
//正则表达式//定界符:// 两个斜杠,在两个斜杠之间写正则:/正则///匹配开始:^//匹配结束:$/*\d代表一个数字\D代表一个非数字\s代表匹配任何不可见字符\S代表匹配任何可见字符\W代表一个单词*代表前面的子表达式出现任意次{n} n确定次数{n,}至少n次,最多不限x|y:可以匹配x ...
分类:
其他好文 时间:
2016-06-02 09:43:23
阅读次数:
138
location表达式类型 ~ 表示执行一个正则匹配,区分大小写 ~* 表示执行一个正则匹配,不区分大小写 ^~ 表示普通字符匹配。使用前缀匹配。如果匹配成功,则不再匹配其他location。 = 进行普通字符精确匹配。也就是完全匹配。 @ “@” 定义一个命名的 location,使用在内部定向时 ...
分类:
其他好文 时间:
2016-06-02 00:29:35
阅读次数:
235
一、正则表达式的含义及特点 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。PHP中使用PCRE库函数进行正则匹配,比如用preg_match用于执行一个正则匹配,常用来判断一类字 ...
分类:
Web程序 时间:
2016-06-01 22:52:48
阅读次数:
237
JDK 中与正则表达式有关的类都在 java.util.regex 包中 基本使用方法 正则匹配 以下是 java.util.regex.Matcher 的部分源码,列举的都是与匹配操作相关的常用方法: 三类匹配操作 1、整体匹配:matches() 等价于使用了位置匹配的元字符^和$,举个例子,给 ...
分类:
编程语言 时间:
2016-06-01 21:03:09
阅读次数:
263
匹配之前先要观察订单号的特点;首先都是数字,那么就匹配出数字,然后是以0开头的数字,就再加上一个限定条件开头是0,然后长度都是12个字节,那就再加上一个字节限制; 最后就是这样的 "/0\d{11}/" 来个正则匹配,用这个函数preg_match_all($preg,$str,$match);... ...
分类:
其他好文 时间:
2016-06-01 15:30:42
阅读次数:
140