Python3.4 获取百度网页源码并保存在本地文件中

时间：2016-07-21 12:36:00 阅读：178 评论：0 收藏：0 [点我收藏+]

标签：

最近学习python

版本 3.4

抓取网页源码并且保存在本地文件中

import urllib.request

url=‘http://www.baidu.com‘

#上面的url一定要写明确，如果写成www.baidu.com,下一步就会报错。
response=urllib.request.urlopen(url)
#下一步获取html,但是是Byte格式的，我们要解码
html=response.read()
html_str=html.decode(‘utf-8‘)

#下面我们把get的网页写在文件中。
f=open(r‘D:\baidu.html‘,‘w‘,encoding=‘utf-8‘)

f=write(html_str)
#写完别忘记关闭
f.close()

string和byte类型相互转换

str.encode(‘utf-8‘)

byte.decode(‘utf-8‘)

Python3.4 获取百度网页源码并保存在本地文件中

标签：

原文地址：http://www.cnblogs.com/SunnyZhu/p/5691277.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行