1. 科普
通用搜索引擎处理的对象是互联网的网页,目前网页的数量数以亿计,所以搜索引擎面临的第一个问题是如何设计出高效的下载系统,已将海量的网页下载到本地,在本地形成互联网网页的镜像。网络爬虫就是担当此大任的。
抓取网页的过程其实和读者平时使用IE浏览器浏览网页的道理是一样的。比如说你在浏...
分类:
编程语言 时间:
2014-05-07 02:41:56
阅读次数:
368
1、异常 例如: def fetcher(obj,index): return obj[index]
def catcher(): ...
分类:
编程语言 时间:
2014-05-07 01:51:04
阅读次数:
460
目录计算机概述数据总线CPU存储器输入/输出设备计算机的时标系统计算机概述计算机的基本组成:存储器:
实现记忆功能的部件用来存放计算程序及参与运算的各种数据运算器: 负责数据的算术运算和逻辑运算即数据的加工处理控制器:
负责对程序规定的控制信息进行分析,控制并协调输入,输出操...
分类:
其他好文 时间:
2014-05-07 01:45:49
阅读次数:
568
(1)pyhton
shell下导入MySQLdb失败。http://pypi.python.org/pypi/MySQL-python/(2)下载解压MySQL-python。http://pypi.python.org/packages/source/M/MySQL-python/MySQL-p...
分类:
数据库 时间:
2014-05-07 01:38:05
阅读次数:
502
Ubuntu安装Matplotlibubuntu下安装matplotlib的复杂度远远比windows下复杂的多,相对双击就能解决问题的,现在你需要时不时的解决编译带来的各种问题。1sudo
apt-get install python-dev先安装numpy:12python setup.py b...
分类:
编程语言 时间:
2014-05-07 01:04:09
阅读次数:
606
为了使第三方开发者能够为用户提供更多更有价值的个性化服务,微信公众平台开放了许多接口,包括自定义菜单接口、客服接口、获取用户信息接口、用户分组接口、群发接口等,开发者在调用这些接口时,都需要传入一个相同的参数access_token,它是公众账号的全局唯一票据,它是接口访问凭证。 access_token的有效期是7200秒(两小时),在有效期内,可以一直使用,只有当access_token过期时...
分类:
微信 时间:
2014-05-06 22:25:24
阅读次数:
743
可以使用python3中的concurrent模块,如果python环境是2.7的话,需要下载https://pypi.python.org/packages/source/f/futures/futures-2.1.6.tar.gz#md5=cfab9ac3cd55d6c7ddd0546a9f22f453此futures包即可食用concurrent模块。官方文档:http://pythonhosted.org//futures/对于..
分类:
编程语言 时间:
2014-05-06 20:22:07
阅读次数:
725
#vim:tabstop=4shiftwidth=4softtabstop=4
#Copyright2010UnitedStatesGovernmentasrepresentedbythe
#AdministratoroftheNationalAeronauticsandSpaceAdministration.
#Copyright2011JustinSantaBarbara
#AllRightsReserved.
#Copyright(c)2010CitrixSystems,Inc.
#
#Licensed..
分类:
数据库 时间:
2014-05-06 20:19:17
阅读次数:
629
org.apache.log4j.Logger详解1.概述1.1.背景在应用程序中添加日志记录总的来说基于三个目的:监视代码中变量的变化情况,周期性的记录到文件中供其他应用进行统计分析工作;跟踪代码运行时轨迹,作为日后审计的依据;担当集成开发环境中的调试器的作用,向文件或控制台打印代码..
分类:
其他好文 时间:
2014-05-06 20:04:27
阅读次数:
431