首页 > Web开发 > 详细

人生苦短之爬虫爬取网页的通用代码框架

时间：2018-06-14 11:40:34 阅读：189 评论：0 收藏：0 [点我收藏+]

标签：问题人生 strong 高级访问一个 get 选择 auto

我们首先打开IDLE选择File->new window命令（或者可以直接按键Ctrl+N键，在很多地方这个按键是新建文件的意思）

在这里还是要推荐下我自己建的Python开发学习群：725479218，群里都是学Python开发的，如果你正在学习Python ，小编欢迎你加入,大家都是软件开发党，不定期分享干货（只有Python软件开发相关的），包括我自己整理的一份2018最新的Python进阶资料和高级开发教程，欢迎进阶中和进想深入Python的小伙伴

我们填入代码：

技术分享图片

保存文件是按键快捷键Ctrl+S，将源代码保存为hello.py的文件

按键F5运行走起（同时我们可以选择Run->Run Module命令）

IDLE中显示出现错误：

技术分享图片

原因是name‘name’未定义

注意：这里需要一个长的下划线，才能使其正确，以用来区分python本身的语法

改正过后我们再次运行：

技术分享图片

我们看到出现了和之前一样的结果

我们将网页连接修改一下看看会出现什么结果：

技术分享图片

结果是“产生异常”

解释一下通用代码框架：get方法请求一个链接，r.raise_for_status用来判断请求是否正常（也就是200），否则就产生异常。r.encoding = r.apparent_encoding这一句是能够是我们请求返回网页解码是正确的，最后return返回网页的内容。

此框架用来解决我们访问网页的问题。

今天的内容就是这样，每天一点点，重在坚持。加油！！！

人生苦短之爬虫爬取网页的通用代码框架

标签：问题人生 strong 高级访问一个 get 选择 auto

原文地址：https://www.cnblogs.com/CoXieLearnPython/p/9181018.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！