码迷,mamicode.com
首页 > 其他好文 > 详细

搜索引擎搜索

时间:2017-10-12 13:56:44      阅读:618      评论:0      收藏:0      [点我收藏+]

标签:imp   百度搜索   sts   www   方法   .com   encoding   app   百度搜   

模拟搜索引擎的关键是知道该搜索引擎的关键词接口

  百度的关键词接口是:http://www.baidu.com/s?wd=KEYWORD

  360搜索的关键词接口是:http://www.so.com/s?q=KEYWORD

 

百度搜索Python:

import requests
keyword = "Python"
url = ‘http://www.baidu.com/s‘
try:
  kv = {‘wd‘:‘keyword‘}
  r = requests.get(url,params=kv)
  print(r.request.url)
  r.raise_for_status()
  r.encoding = r.apparent_encoding
  print(len(r.rext))
  print(r.text[:1000])
except:
  print("爬取失败")

 

 

360搜索Python:

import requests
keyword = "Python"
url = ‘http://www.so.com/s‘
try:
  kv = {‘q‘:‘keyword‘}
  r = requests.get(url,params=kv)
  print(r.request.url)
  r.raise_for_status()
  r.encoding = r.apparent_encoding
  print(len(r.rext))
  print(r.text[:1000])
except:
  print("爬取失败")

 

 

任意给一个搜索引擎,获取它的搜索接口的方法为:

以百度为例,在百度搜索框内输入Python,直接搜索,然后在地址框内找到&wd=Python字样的,则百度的搜索接口就是百度的搜索网址加上wd

 

搜索引擎搜索

标签:imp   百度搜索   sts   www   方法   .com   encoding   app   百度搜   

原文地址:http://www.cnblogs.com/tianxxl/p/7655623.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!