标签:lib 验证 内容 对象 url 抓取 作用 read 服务器
1---uillib是python标准库中最常用的一个python网络应用资源访问的模块,他可以让你像访问文本一样,读取网页的内容
它的作用是访问一些不需要验证的网络资源和cookie等
uillib模块提供了一个网络资源访问的超级简单移动的api接口,还包括一些函数方法用于对参数编码,下载网页文件等操作。这个模块的使用门槛非常低,初期者也可以尝试抓取和读取或者保存网络资源
import uillib #它是标准库中的模块,不需要额外下载
print urllib。urlopen(“http://www.iplay.com/”).read()
这两行代码可以将对应这个网址下的内容读到终端上
urllib.urlopen()返回一个类文件的python对象,有下面方法才可以使用
1)read(),readline(),readlines(),fileno(),close(),与那个os的那个模块操作 文件一样
2)info(),返回一个httplib.HTTPMessage这个Python对象,可以显示你访问的网络资源服务器的HTTp头部信息
3)getcode(),它的作用就是返回http网页状态码,200是成功访问,404是未找到,还有其它301状态码等可以查询python的相关资料
4)geturl()返回你请求的url地址
举一个例子:
import urllib
baidu=urllib.urlopen(‘http://www.baidu.com/‘)
print baidu.info #输出百度首页头部信息
print baidu.getcode() #输出百度首页网页的状态码
print baidu1.geturl() #输出请求的url地址
for line in baidu
print line
baidu.close() #关闭对象方法
2---
标签:lib 验证 内容 对象 url 抓取 作用 read 服务器
原文地址:http://www.cnblogs.com/xiaoyoucai/p/6538422.html