码迷,mamicode.com
首页 > 编程语言 > 详细

Python爬取网页全代码

时间:2018-05-15 15:57:24      阅读:463      评论:0      收藏:0      [点我收藏+]

标签:_for   sts   代码   raise   360搜索   产生   百度搜   port   for   

#爬取京东全代码

import requests
url = "http://item.jd.com/2967929.html"
try:
r = requests.get(url)
r.raise_for_status() #在返回200不产生异常,否则会产生异常
r.encoding = r.apparent_encoding
print(r.text[:10000])
except:
print("爬取失败")

#爬取亚马逊全代码
import requests
url = "https://www.amazon.cn/gp/product/B01M8L5Z3Y"
try:
kv = {‘user-agent‘:‘Mozilla/5.0‘}
r = requests.get(url,headers=kv)
r.raise_for_status() #在返回200不产生异常,否则会产生异常
r.encoding = r.apparent_encoding
print(r.text[1000:2000])
except:
print("爬取失败")
#爬取百度搜索全代码
import requests
keyword = "Python"
try:
kv = {‘wd‘:keyword}
r = requests.get("http://www.baidu.com/s",params=kv)
print(r.request.url)
r.raise_for_status()
print(len(r.text))
except:
print("爬取失败")
#爬取360搜索全代码
import requests
keyword = "Python"
try:
kv = {‘q‘:keyword}
r = requests.get("http://www.so.com/s",params=kv)
print(r.request.url)
r.raise_for_status()
print(len(r.text))
except:
print("爬取失败")

Python爬取网页全代码

标签:_for   sts   代码   raise   360搜索   产生   百度搜   port   for   

原文地址:https://www.cnblogs.com/zhenshj/p/9041027.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!