Python爬取网页全代码

时间：2018-05-15 15:57:24 阅读：463 评论：0 收藏：0 [点我收藏+]

标签：_for sts 代码 raise 360搜索产生百度搜 port for

#爬取京东全代码

import requests
url = "http://item.jd.com/2967929.html"
try:
    r = requests.get(url)
    r.raise_for_status() #在返回200不产生异常，否则会产生异常
    r.encoding = r.apparent_encoding
    print(r.text[:10000])
except:
    print("爬取失败")

#爬取亚马逊全代码
import requests
url = "https://www.amazon.cn/gp/product/B01M8L5Z3Y"
try:
    kv = {‘user-agent‘:‘Mozilla/5.0‘}
    r = requests.get(url,headers=kv)
    r.raise_for_status() #在返回200不产生异常，否则会产生异常
    r.encoding = r.apparent_encoding
    print(r.text[1000:2000])
except:
    print("爬取失败")

#爬取百度搜索全代码
import requests
keyword = "Python"
try:
    kv = {‘wd‘:keyword}
    r = requests.get("http://www.baidu.com/s",params=kv)
    print(r.request.url)
    r.raise_for_status()
    print(len(r.text))
except:
    print("爬取失败")

#爬取360搜索全代码
import requests
keyword = "Python"
try:
    kv = {‘q‘:keyword}
    r = requests.get("http://www.so.com/s",params=kv)
    print(r.request.url)
    r.raise_for_status()
    print(len(r.text))
except:
    print("爬取失败")

Python爬取网页全代码

标签：_for sts 代码 raise 360搜索产生百度搜 port for

原文地址：https://www.cnblogs.com/zhenshj/p/9041027.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行