码迷,mamicode.com
首页 > 其他好文 > 详细

爬虫02-简单伪装浏览器

时间:2020-03-11 11:00:16      阅读:67      评论:0      收藏:0      [点我收藏+]

标签:apple   python   div   htm   int   headers   lag   arch   list   

from urllib import parse
from urllib import request
# url="https://www.lagou.com/jobs/list_python?labelWords=&fromSearch=true&suginput="
url="https://www.lagou.com/jobs/positionAjax.json?needAddtionalResult=false"
headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36",
         "Referer":"https://www.lagou.com/jobs/list_python?labelWords=&fromSearch=true&suginput="}

data={
    "frist":"ture",
    "pn":"1",
    "kd":"python"
}

req=request.Request(url,headers=headers,data=parse.urlencode(data).encode("utf-8"),method="POST")#发起请求,
resp=request.urlopen(req)
print(resp.read().decode("utf-8"))

  

爬虫02-简单伪装浏览器

标签:apple   python   div   htm   int   headers   lag   arch   list   

原文地址:https://www.cnblogs.com/wcyMiracle/p/12460638.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!