码迷,mamicode.com
首页 > Web开发 > 详细

用urllib爬取页面

时间:2019-12-15 12:43:09      阅读:88      评论:0      收藏:0      [点我收藏+]

标签:enc   decode   mozilla   div   baidu   utf-8   爬取   import   pytho   

# 引入扩展
from urllib import request, error,  parse

# 定义url、请求头、请求参数
url = "http://www.baidu.com"
headers = {‘User-Agent‘: ‘Mozilla/5.0 3578.98 Safari/537.36‘}
data = {‘wd‘: ‘python‘}

#请求
data = parse.urlencode(data).encode(‘utf-8‘)
url = request.Request(url, headers=headers, data=data)
print(request.urlopen(url).read().decode(‘utf-8‘))

  

用urllib爬取页面

标签:enc   decode   mozilla   div   baidu   utf-8   爬取   import   pytho   

原文地址:https://www.cnblogs.com/waterliang/p/12043573.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!