学校的服务器可以上外网了,所以打算写一个自动爬取笑话并发到bbs的东西,从网上搜了一个笑话网站,感觉大部分还不太冷,html结构如下:
可以看到,笑话的链接列表都在里面,用正则表达式可以把最近的几个笑话地址找出来,再进到一个笑话页面看下:
每一个笑话页面里面是有多个小笑话组成的,全部在标签下,每个小笑话又单独一个包裹,这样非常容易...
分类:
编程语言 时间:
2014-05-15 11:18:58
阅读次数:
362
只需要在编辑器里打开替换的对话框,输入^\d*\. 然后选择Regular expressions(正则表达式),点击Replace ALL(替换全部)。
例如sublime中,如图:...
分类:
编程语言 时间:
2014-05-15 07:10:40
阅读次数:
330
C# 正则表达式判断是否是数字、是否含有中文、是否是数字字母组合...
分类:
其他好文 时间:
2014-05-15 05:31:20
阅读次数:
210
1.什么是re
正则表达式一门相对通用的语言,在python中也有对正则表达式的支持,那就是的内置re模块。正则表达式就是一系列的规则去匹配字符串然后进行相应的操作,这些规则网上一搜一大片,而re则是运用正则表达式来提供一系列的功能强大的接口让我们来调用。通常我们在对日志文件进行操作的时候会对正则表达式运用的比较多来得到我们希望得到的数据。
2.python中的转义符...
分类:
编程语言 时间:
2014-05-15 03:58:49
阅读次数:
465
正整数或一位小数或者俩位小数的正则表达式的写法
^(?!0+(?:\.0+)?$)(?:[1-9]\d*|0)(?:\.\d{1,2})?$...
分类:
Web程序 时间:
2014-05-14 19:18:16
阅读次数:
438
-------android培训、java培训、期待与您交流!----------正则表达式:符合一定规则的表达式。作用:用于专门操作字符串。特点:用一些特定的符合来表示一些代码操作,这样就简化书写。所以学习正则表达式,就是在学习一些特殊符号的使用。好处:可以简化对字符串的复杂操作。..
分类:
其他好文 时间:
2014-05-14 18:50:33
阅读次数:
358
grep命令可以从文本中或者通过管道送过来的字符流中或一个"-"符号代替文件名来搜索精确或者模糊的匹配信息,grep家族有三个命令:grep,egrep,fgrep。grep支持正则表达式匹配查找egrep支持扩展正则表达式匹配查找fgrep不支持正则表达式匹配查找grep命令的格式:grep[OPT]‘PATTERN‘F..
分类:
系统相关 时间:
2014-05-14 17:24:27
阅读次数:
428
上一篇文章总结了一些grep基本用法。在这次的内容里介绍grep和正则表达式结合使用的方法。首先介绍下正则表达式,正则表达式非基本和扩展两种。名词释义:正则表达式:正则表达式其实就是描述某些复杂规则字符串的代码集合。元字符:在正则表达式中具有特殊意义的专用字符正则..
分类:
其他好文 时间:
2014-05-14 15:52:01
阅读次数:
244
Asp 使用 Microsoft.XMLHTTP 抓取网页内容(没用乱码),并过滤需要的内容...
分类:
Web程序 时间:
2014-05-14 15:18:16
阅读次数:
368
作者:zccst正则表达式是常学常新的知识点,一点点积累吧,今天重点看replace,以前印象中应该:str.replace(old,new);即从从原字符串中找到old,然后用new来替换。今天发现,第二个参数还可以是一个函数,而且该函数还有两个参数。例如,jQuery中$.camelCase的实...
分类:
Web程序 时间:
2014-05-14 12:10:21
阅读次数:
308