正则表达式爬虫应用(校花网) 1 import requests 2 import re 3 import json 4 #定义函数返回网页的字符串信息 5 def getPage_str(url): 6 page_string=requests.get(url) 7 return page_str ...
分类:
编程语言 时间:
2017-07-04 18:20:09
阅读次数:
210
会简化一些代码流程,比如 上面这段代码,分析后其实就是 ...
分类:
编程语言 时间:
2017-07-04 18:14:32
阅读次数:
235
生成器表达式形式 直接上代码 输出结果 生成器的表达式形式,在每一个包含生成器表达式形式的函数写完后,都必须要执行第一次__next__方法初始化后(即传入一个的默认返回值None),才能够使用send()方法传入值,否则会抛出TypeError错误。 初始化装饰器:使用装饰器装饰的方法进行函数定义 ...
分类:
编程语言 时间:
2017-07-04 18:11:15
阅读次数:
171
搜索引擎是“对网络信息资源进行搜集整理并提供信息查询服务的系统,包括信息搜集、信息整理和用户查询三部分”。如图1是搜索引擎的一般结构,信息搜集模块从网络采集信息到网络信息库之中(一般使用爬虫);然后信息整理模块对采集的信息进行分词、去停用词、赋权重等操作后建立索引表(一般是倒排索引)构成索引库;最后 ...
分类:
编程语言 时间:
2017-07-04 18:09:07
阅读次数:
1508
类的继承与派生 经典类和新式类 在python3中,所有类默认继承object,但凡是继承了object类的子类,以及该子类的子类,都称为新式类(在python3中所有的类都是新式类) 没有继承object类的子类成为经典类(在python2中,没有继承object的类,以及它的子类,都是经典类) ...
分类:
编程语言 时间:
2017-07-04 18:08:20
阅读次数:
263
1、克隆autojump的repo,Terminal下执行: git clone git://github.com/joelthelion/autojump.git 然后进入clone下来的目录,执行安装脚本: ./install.python 在安装过程中,会在~/下建立.autojump文件夹 ...
分类:
其他好文 时间:
2017-07-04 18:07:56
阅读次数:
154
面向对象变成介绍 面向过程编程 核心是过程(流水线式思维),过程即解决问题的步骤,面向过程的设计就好比精心设计好一条流水线,考虑周全什么时候处理什么东西。主要应用在一旦完成很少修改的地方,如linux内核、git、apache服务器等 优点:极大的降低了程序的设计复杂度 缺点:可扩展性差,改动一个地 ...
分类:
编程语言 时间:
2017-07-04 17:01:10
阅读次数:
172
github入门 简介: 很多人都知道,Linus在1991年创建了开源的Linux,从此,Linux系统不断发展,已经成为最大的服务器系统软件了。 Linus虽然创建了Linux,但Linux的壮大是靠全世界热心的志愿者参与的,这么多人在世界各地为Linux编写代码,那Linux的代码是如何管理的 ...
分类:
编程语言 时间:
2017-07-04 17:00:36
阅读次数:
152
在计算机程序的开发过程中,随着程序代码越写越多,在一个文件里代码就会越来越长,越来越不容易维护。 为了编写可维护的代码,我们把很多函数分组,分别放到不同的文件里,这样,每个文件包含的代码就相对较少,很多编程语言都采用这种组织代码的方式。在Python中,一个.py文件就称之为一个模块(Module) ...
分类:
其他好文 时间:
2017-07-04 16:38:30
阅读次数:
167
什么是序列化(picking)? 什么是序列化(picking)? 我们把变量从内存中变成可存储或传输的过程称之为序列化。 序列化之后,就可以把序列化后的内容写入磁盘,或者通过网络传输到别的机器上。 反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化,即unpickling。 举例:大家应 ...
分类:
编程语言 时间:
2017-07-04 16:36:54
阅读次数:
188