码迷,mamicode.com
首页 > 编程语言 > 详细

利用Python爬取图片信息

时间:2017-10-20 16:05:06      阅读:221      评论:0      收藏:0      [点我收藏+]

标签:err   字符   logs   格式   爬取图片   返回   字符串   doctype   ext   

利用Python完成简单的爬虫

  最近学习到了爬虫,瞬时觉得很高大上,想取什么就取什么,感觉要上天。这里分享一个简单的爬取汽车之家文章列表的图片教程,供大家学习。

需要的知识点储备

  本次爬虫脚本依赖两个模块:requests模块,BeautifulSoup模块。其中requests模块完成url的请求,而BeautifulSoup模块负责解析Html标签。

requests模块

  requests.get(url)  向URL发起GET请求

  requests.post(url)  向URL发起POST请求

>>> import requests
>>> response = requests.get(‘https://www.baidu.com‘)
>>> print(response.text)
<!DOCTYPE html>

<!--STATUS OK--><html> <head><meta http-equiv=content-type content=text/html;charset=utf-8><meta http-equiv=X-UA-Compatible content=IE=Edge><meta content=always name=referrer><link rel=styleshee
......
......
</body> </html>

# 上面为页面信息

>>> 

  可以看到response是服务端返回的信息:在requests内部也被封装成了一个对象,它具有的方法:有response.text,response.content,response.encode

    1. response.text:以字符串的形式显示返回的信息  
    2. response.content:以字节的形式显示返回的信息  
    3. response.encode:告诉requests 已什么编码格式进行解析  

  

利用Python爬取图片信息

标签:err   字符   logs   格式   爬取图片   返回   字符串   doctype   ext   

原文地址:http://www.cnblogs.com/dachenzi/p/7699588.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!