码迷,mamicode.com
首页 > 编程语言 > 详细

python3爬虫第一天(1)

时间:2018-04-22 13:58:10      阅读:147      评论:0      收藏:0      [点我收藏+]

标签:转换   pytho   find   代码   jpg   png   ima   dal   XA   

1.目标:用python3爬取慕课网课程页的图片,然后保存到本地。技术分享图片

       

      2。打开pycharm编写python代码。思路如下:

            2.1 . 从urllib库里导入request模块。

            2.2  用request模块下的urlopen方法打开网页获取一个http响应对象

            2.3 响应对象调用.read()方法转换成字节流,类似与\r\n\xe5\x90\x8e\xe7\xab\xaf\

            2.4  提取字节流中的图片链接,用findall(r‘正则表达式‘,字节流),我用的正则findall(r‘src.+\.jpg‘,realhtml)

            2.5 把图片中的链接进行优化,加上‘http’

            2.6 写个for循环,每次循环就新建一个文件,然后把url依次从图片链接表里拿出来,然后再调用

     request.urlopen(url),req.read(),然后把读取的字节流放在图片里。代码如下
3.

技术分享图片

  4.在本地生成图片如下。

技术分享图片

 

 

python3爬虫第一天(1)

标签:转换   pytho   find   代码   jpg   png   ima   dal   XA   

原文地址:https://www.cnblogs.com/zhuhaibao/p/8906729.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!