码迷,mamicode.com
首页 > 编程语言 > 详细

python3.x以上 爬虫 使用问题 urllib(不能使用urllib2)

时间:2018-04-17 17:01:53      阅读:280      评论:0      收藏:0      [点我收藏+]

标签:size   首页   包括   出现   3.x   erro   url   port   lib   

问题一: python 3.x 以上版本揽括了 urllib2,把urllib2 和 urllib 整合到一起。

 并且引入模块变成一个,只有 import urllib

# import urllib
# import urllb2

#正确使用

import urllib

  

  所以不能使用 urllib2.urlopen()方法,否则会报错无此模块。

NameError: name ‘urllib2‘ is not defined

  

 3.x以上版本 # urllib2.open  不能使用,用urllib.request 模块 代替urllib2

1 import urllib.request
2 
3 response = urllib.request.urlopen(‘http://www.baidu.com)

 

问题二: 变量名不能与引入模块名方法相同,否则会引起错误

  

 1 import urllib.request
 2 
 3 #错误写法
 4 
 5 request = urllib.request.urlopen(‘http://www.baidu.com)
 6 
 7 #否则 TypeError: ‘module‘ object is not callable
 8 
 9 #正确写法
10 
11 rqs = urllib.request.urlopen(‘http://www.baidu.com)

问题四 print 输出问题

  3.x  版本 print 已经成为一个方法, 输出任何东西都要需要被 ()括号 包括,不然会出现问题

 

第一步初步 方法 爬去百度首页

1 import urllib.request
2 
3 rqs = urllib.request.urlopen(http://www.baidu.com)
4 
5 html = rqs.read()
6 
7 print(html)

 

python3.x以上 爬虫 使用问题 urllib(不能使用urllib2)

标签:size   首页   包括   出现   3.x   erro   url   port   lib   

原文地址:https://www.cnblogs.com/yanqz/p/8867189.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!