此文承接上文,让我们写一个简简单单的爬虫,循序而渐进不是吗?此次进行的练习是爬取前5页什么值得买网站中的白菜价包邮信息。包括名称,价格,推荐人,时间。 我们所需要做的工作:1.确定URL并获得页面代码。 2.用正则匹配每件商品我们所需要的内容 3.打印信息 我还是直接上代码吧,具体步骤看注释就...
分类:
编程语言 时间:
2016-01-18 17:17:37
阅读次数:
186
项目上线要求当中有言论和昵称的过滤需求, 客户端使用的是python脚本, python脚本中直接利用re模块来进行正则匹配, 一开始的做法是开启游戏后, 每帧编译2条正则式, 无奈运营需求里面100+条略为复杂的正则式, 一条编译起来在pc上都需要80ms, 造成客户端开启时候的卡顿. 解决...
分类:
编程语言 时间:
2016-01-17 14:42:12
阅读次数:
636
//身份证正则表达式(15位) isIDCard1=/^[1-9]\d{7}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}$/; //身份证正则表达式(18位) isIDCard2=/^[1-9]\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([...
分类:
其他好文 时间:
2016-01-11 13:37:03
阅读次数:
194
有如下数组,要从中取出id: "[\"3812662409\",\"3812633637\",\"3812627686\",\"3812651467\",\"3812628047\",\"3812650203\"]" 正则匹配可以直接用(\d+),假定上述数组为变量名为input的字符串,C#中可以...
分类:
编程语言 时间:
2016-01-11 13:32:33
阅读次数:
139
[03.正则表达式总结] 里有说明#正则匹配,只会返回组的内容,分组但是又不是组的形式: (?:...)s = "1.3.2.2 asp.net0000"#匹配章节号1.3.2.2print re.findall(r"^(\d+)(\.\d+)+",s)print re.findall(r"^(?:...
分类:
其他好文 时间:
2016-01-08 20:21:04
阅读次数:
133
只能输英文: 只能输入汉字: 只能输入英文、数字、@符号和.?\:符号: 只能输入英文字母和数字,不能输入中文: 只能输入数字、字母、下划线: 只能输入数字的:
分类:
Web程序 时间:
2016-01-08 18:51:15
阅读次数:
153
正则表达式正则表达式是对字符串操作的一种逻辑公式, 用事先定义好的一些特定字符、及这些特定字符的组合, 组成一个"规则字符串",这个"规则字符串"用来表达对字符串的一种过滤逻辑,正则表达式就是用于描述这些规则的工具,或者说, 正则表达式就是记录文本规则的代码.在开发中, 我们经常会有查找符合某些复杂...
分类:
移动开发 时间:
2016-01-03 23:59:18
阅读次数:
523
中文的unicode范围\u4e00-\a = new RegExp("[\\u4e00-\\u9fa5]",'g')b= '中文111'a.exec(b)b.match(a)主要因为可能计算屏幕上中文和其他字符混排的时候所占的宽度
分类:
编程语言 时间:
2015-12-23 17:52:08
阅读次数:
177
反斜杠在正则表达式中是转义的,\b,\t,\s等都是有其含义,但是在字符串中我们不能把它和在正则中完全的一样对待。比如/\s12\s/这个正则匹配的是开头空白,中间12,后边是空白的字符串,但是如果写成"\s12\s"就不行了,需要写成"\\s12\\s",但是"\t12\t" 就等于 /\t12\...
分类:
其他好文 时间:
2015-12-16 15:27:43
阅读次数:
135
Ctrl+F可以查找数据。Ctrl+H可以开启替换面板,可以通过正则表达式进行匹配数据 蓝色框的变量 $1, 就是正则匹配到的数据(红色标示);多个正则表达式则依次类推 $1,$2,$3等。
分类:
其他好文 时间:
2015-12-04 20:56:55
阅读次数:
255