学校的服务器可以上外网了,所以打算写一个自动爬取笑话并发到bbs的东西,从网上搜了一个笑话网站,感觉大部分还不太冷,html结构如下:
可以看到,笑话的链接列表都在里面,用正则表达式可以把最近的几个笑话地址找出来,再进到一个笑话页面看下:
每一个笑话页面里面是有多个小笑话组成的,全部在标签下,每个小笑话又单独一个包裹,这样非常容易...
分类:
编程语言 时间:
2014-05-15 11:18:58
阅读次数:
362
【斐波那契序列】
序列中的每一个新项都是它前两项的和。
0 1 1 2 3 5 8 13 21 34 55 89 144 …………
数学表达式表示序列中的一个新项: tN = tN-1 + tN-2
像这种类型的表达式,序列中的每一个元素都是由先前的元...
分类:
其他好文 时间:
2014-05-15 02:47:45
阅读次数:
211
OJ升级,代码可能会丢失. 所以要事先备份. 一开始傻傻的复制粘贴, 后来实在不能忍, 得益于大潇的启发和聪神的原始代码, 网页爬虫走起!
已经有段时间没看Python, 这次网页爬虫的原始代码是 python2.7版本, 试了一下修改到3.0版本, 要做很多包的更替,感觉比较烦,所以索性就在这个2.7版本上完善了.
首先观赏一下原始代码,我给加了一些注释:
# -*-...
分类:
编程语言 时间:
2014-05-15 02:39:45
阅读次数:
439
Regular Expression Matching,正则表达式...
分类:
其他好文 时间:
2014-05-15 02:35:05
阅读次数:
241
题意:最大连续子序列和,在一个数组中找到和最大的连续子数组
思路:dp, 对于第i个数,有两种选择:把它加入在子数组里,不加入子数组(子数组到此结束)
加不加入子数组,要比较它加入前后子数组的总和是变大了还是变小了,如果变大则加入,变小则不加入
所以,我们需要记录以i-1结尾的子数组的总和,最后的结果在这些总和中取最大的那个
f[i] = max(f[i-1]+a[i],f[i-1]);
max({f[i]})
实现时用两个变量,一个保存f[i-1],一个保存目前为止最大的f[i]
复杂度:时间O(n),空...
分类:
其他好文 时间:
2014-05-14 21:53:14
阅读次数:
250
为Python添加默认模块搜索路径
方法一:函数添加
1) import sys
2) 查看sys.path
3) 添加sys.path.append("c:\\")
方法二:修改环境变量
windows用户可以修改系统环境变量PYTHONPATH
方法三:增加.pth文件,推荐!
在site-packages添加一个路径文件,如mypkpath.pth,必须以...
分类:
编程语言 时间:
2014-05-14 21:21:27
阅读次数:
419
正整数或一位小数或者俩位小数的正则表达式的写法
^(?!0+(?:\.0+)?$)(?:[1-9]\d*|0)(?:\.\d{1,2})?$...
分类:
Web程序 时间:
2014-05-14 19:18:16
阅读次数:
438
-------android培训、java培训、期待与您交流!----------正则表达式:符合一定规则的表达式。作用:用于专门操作字符串。特点:用一些特定的符合来表示一些代码操作,这样就简化书写。所以学习正则表达式,就是在学习一些特殊符号的使用。好处:可以简化对字符串的复杂操作。..
分类:
其他好文 时间:
2014-05-14 18:50:33
阅读次数:
358
grep命令可以从文本中或者通过管道送过来的字符流中或一个"-"符号代替文件名来搜索精确或者模糊的匹配信息,grep家族有三个命令:grep,egrep,fgrep。grep支持正则表达式匹配查找egrep支持扩展正则表达式匹配查找fgrep不支持正则表达式匹配查找grep命令的格式:grep[OPT]‘PATTERN‘F..
分类:
系统相关 时间:
2014-05-14 17:24:27
阅读次数:
428
上一篇文章总结了一些grep基本用法。在这次的内容里介绍grep和正则表达式结合使用的方法。首先介绍下正则表达式,正则表达式非基本和扩展两种。名词释义:正则表达式:正则表达式其实就是描述某些复杂规则字符串的代码集合。元字符:在正则表达式中具有特殊意义的专用字符正则..
分类:
其他好文 时间:
2014-05-14 15:52:01
阅读次数:
244