码迷,mamicode.com
首页 > Web开发 > 详细

urllib 库的基础和实用(1)

时间:2018-05-18 13:53:14      阅读:206      评论:0      收藏:0      [点我收藏+]

标签:getc   实用   filename   这一   地址   from   inf   页面   设置   

对于urllib中我们先需要导入你想实用的类

 import urllib

 一般需要爬取信息等

import urllib.request

或 from urllib import request ,当程序导入完

我们先说说 urllib 下一些常用的方法吧

比如说:

        urllib.request.urlopen("网页路径")

        urllib.request.uropen("网页路径",timeout="设置爬取时间")

//这一般是读取你需要的网页页面信息

       urllib.request.urlretrieve("网页地址",filename="本地磁盘地址")

 //把你需要的网页信息爬在本地磁盘

       urllib.request.urlcleanup()

//清除爬取缓存 是什么意思呢?就比如说你要爬取网页到自己磁盘本地时,缓存中就存在的操作进行清除

n.info()

//查看你网页的环境信息

getcode()  //返回当前网页的状态

geturl()//查看网页地址

 

urllib 库的基础和实用(1)

标签:getc   实用   filename   这一   地址   from   inf   页面   设置   

原文地址:https://www.cnblogs.com/chunqing/p/9055180.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!