利用Python爬取图片信息

时间：2017-10-20 16:05:06 阅读：221 评论：0 收藏：0 [点我收藏+]

标签：err 字符 logs 格式爬取图片返回字符串 doctype ext

利用Python完成简单的爬虫

　　最近学习到了爬虫，瞬时觉得很高大上，想取什么就取什么，感觉要上天。这里分享一个简单的爬取汽车之家文章列表的图片教程，供大家学习。

需要的知识点储备

　　本次爬虫脚本依赖两个模块：requests模块，BeautifulSoup模块。其中requests模块完成url的请求，而BeautifulSoup模块负责解析Html标签。

requests模块

　　requests.get(url) 向URL发起GET请求

　　requests.post(url) 向URL发起POST请求

>>> import requests
>>> response = requests.get(‘https://www.baidu.com‘)
>>> print(response.text)
<!DOCTYPE html>

<!--STATUS OK--><html> <head><meta http-equiv=content-type content=text/html;charset=utf-8><meta http-equiv=X-UA-Compatible content=IE=Edge><meta content=always name=referrer><link rel=styleshee
......
......
</body> </html>

# 上面为页面信息

>>>

　　可以看到response是服务端返回的信息：在requests内部也被封装成了一个对象，它具有的方法：有response.text,response.content,response.encode

1. response.text：以字符串的形式显示返回的信息　　
2. response.content：以字节的形式显示返回的信息　　
3. response.encode：告诉requests 已什么编码格式进行解析

利用Python爬取图片信息

标签：err 字符 logs 格式爬取图片返回字符串 doctype ext

原文地址：http://www.cnblogs.com/dachenzi/p/7699588.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行