码迷,mamicode.com
首页 > Web开发 > 详细

谷歌搜索参数url参数详解

时间:2016-01-25 19:03:13      阅读:1598      评论:0      收藏:0      [点我收藏+]

标签:

谷歌搜索表单参数url参数详解

 

q(Query):查询的关键词,搜索查询q是必需的URL参数之一,其他都是可选的。 当q的值包含多个单词时,用加号分隔每个单词。(text)

hl(Interface Language):Google搜索的界面语言
hl=zh-CN简体中文语言界面,我们用的Google中文就是这个参数。
hl=zh-TW繁体中文语言界面,港台地区常使用
hl=en-英文语言界面

lr(Language Restrict):搜索内容的语言限定限定只搜索某种语言的网页。如果lr参数为空,则为搜索所有网页。
常用的有:
lr=lang_zh-CN只搜索简体中文网页
lr=lang_zh-TW只搜索繁体中文网页
lr=lang_zh-CN|lang_zh-TW搜索所有中文网页
lr=lang_en-只搜索英文网页

ie(Input Encoding):查询关键词的编码,缺省设置为utf-8,也就是说请求Google搜索时参数q的值是一段utf-8编码的文字。

oe(Output Encoding):搜索结果页面的网页编码,缺省设置oe=utf-8

safe:切换或关闭谷歌的安全搜索过滤,价值观是积极的可以关闭。safe=strict(安全严格的)

start:显示搜索结果的起始端,如果start=1,则从第2个搜索结果开始显示;如果你想直接看第搜索结果第21页,让start=200即可,由于Google只显示1000条搜索结果记录,start理论取值范围在0--999之间。

num(Number):搜索结果显示条数,取值范围在10--100条之间,缺省设置num=10

newwindow:是否开启新窗口以显示查询结果,缺省设置newwindow=1,在新窗口打开搜索结果而面

strip:仅适用于谷歌的缓存页面。 添加&strip=1到谷歌缓存的URL会导致缓存页面没有显示图像,Javascripts等.这意味着在访问网站的分析中,你没有留下任何浏览量踪迹。

aq(Ascending Query):判断搜索用户是否是第一次查询,如果用户第一次进行查询,则aq=f(First);如若进行过多次查询,则aq=-1,这个的主要作用应该是统计和放置作弊

as_q(Ascending Search Query):上一次查询关键词

as_qdr:在一个至今一天的时间范围内搜索。 使用y表示年,m为一个月,W为一周,d为天,h表示小时,n为分和s为秒。如果你想要大于一的 ,按照以上的字母加上数字就好了。 例如,“m3”为3个月,“H5”是5小时。 只希望看到的最新鲜的结果,就像在过去的5分钟? 指定“n5”。 如果你想寻找之前结束至今的一个日期范围,使用日期范围的运算符或使用“自定义范围”下的在谷歌SERP左侧侧边栏的链接“更多搜索选项”。

as_rights:结果限制为可重复使用的(创作共用许可)的内容。 这可能是一个来自高级的搜索屏幕更直接的行为,但如果你喜欢冒险,cc_publicdomain是公共领域,cc_attribute是重新归属与可用,cc_sharealike意味着你需要提供创作共用许可下的衍生作品1 ,cc_nonderived意味着没有允许的衍生作品,并cc_noncommercial意味着非商业用途。 您可以使用括号、管道符号(|)和和减号把这些合成组,来排除某些商业上有限制牌照许可证类型。 例如, (cc_publicdomain | cc_attribute | cc_sharealike).-(cc_noncommercial | cc_nonderived) 等同于“免费使用,共享或修改,甚至商业上。”以上不会有这些(他们只是增加了可读性)。

as_epq=搜索词组 相当于搜索指令中的"",查询完整搜索词组

as_filetype:as_filetype=文件格式

as_ft:as_ft=i/e 包含、不包含某种文件格式

as_nlo:as_nlo=以及as_nhi 制定搜索词数字范围,例如:as_nlo=7&as_nhi=9就相当于在搜索框中输入“7..9“

as_occt:as_occt=出现搜索关键词的位置(可选值包括:any/body/url/title等)

as_sitesearch:as_sitesearch=将搜索范围限定在一个网站内(例如:as_sitesearch=cnn.com)

as_dt:as_dt=包括、不包括某个域名(i/e)

filter:包括把那些因为和已有结果很相似而被Google省略的listing到搜索结果里面,即是否隐藏重复的结果。

pws:关闭个性化的结果。 PWS的意思是“个性化网络搜索”。 之前,你必须登录到您的谷歌帐户,搜索结果才是个性化。 现在不一样了。 个性化的结果呈现给所有人-无论登陆与否-这是基于180天内链接到您的cookie浏览器的搜寻活动。 为什么 关闭个性化会麻烦,当您可以简单地追加&pws=0Google SERP URL,就可以从Google的搜索中取回非个性化的结果。

imgtype:仅在谷歌图片起效。 选项包括脸,照片,剪贴画,lineart和新闻。

btnG:正常搜索。(submit)

btnI:手气不错,不显示搜索结果页列表,直接跳转到第一个搜索页面。(submit)

tbs:设置搜索页面的时间范围。qdr:d-过去1天,qdr:h-过去1小时,qdr:n-过去1分钟,qdr:s-过去1秒钟,可在时间参数后加入数字,例如qdr:n30为过去30分钟。

tbm:设置搜索类型,如tbm=isch为谷歌图片搜索,tbm=vid为谷歌视频搜索。

source:source=来源类型(如果使用Google工具条搜索,将出现这一部分内容,例如ie7, opera, navclient, navclient-ff - navclient )

client:client=和sourceid类似(例如:safari,firefox-a)

rls:rls=客户端版本、语言(例如:rls=GGLD,GGLD:2003-35,GGLD:en就是Google Desketop的URL部分)

附:东东博客的《Google的搜索来源分布跟踪解读:GGGL与GGLD,sourceid和client,rlz,rls等》

Google出品的参数是sourceid
例如:
FIREFOX工具条: navclient-ff
桌面搜索: gd
IE工具条: navclient

非GOOGLE产品合作伙伴使用client参数
例如:
FireFox内置:firefox-a
傲游浏览器: aff-os-maxthon

更详细的信息是rls参数: 包括首次安装时间和语言版本;
rls=GGGL,GGGL:2006-27,GGGL:zh-CN
2006-27:应该是Google工具条的首次安装时间(于一年中的第几周),和我升级到FireFox 2.x时间接近,第二个参数是工具条的语言,以此类推: GGLD应该代表桌面搜索
例如: rls=GGLD,GGLD:2006-35,GGLD:zh-CN

而最新URL中参数已经增加了: rlz跟踪参数;
例如: rlz=1T4GGLD_zh-CN___CN228
应该是更详细的版本号,安装时间等信息;

 

 

 

Google 查询的 URL 参数

在 Google 搜索里,有许多高级的「搜索设置」,比如屏蔽不需要的结果(Blocking unwanted results),开/关 Google 即搜即得联想功能(Google Instant predictions),设置「每页搜索结果数」等。

同时,这些设置也可以通过修改 Google 查询的 URL 参数来完成,并且灵活性比上述的「搜索设置」更高。

设定输入输出编码

先来看一个最简单的 Google 查询 URL:

https://www.google.com/search?q=vimperator&ie=utf-8&oe=utf-8  

这个 URL 的意思是在 Google 中搜索 “vimperator”,且输入编码(ie – input encoding)为 utf-8,输出编码(oe – output encoding)也为 utf-8。

限定显示结果数目

一般来说,搜索引擎在一页里显示10个结果,Google 里这个数目可以通过「搜索设置」调整为10、20、30、40、50、100,但我们也可以通过 URL 参数来做更多的调整。

仍举上面那个 URL 为例:

https://www.google.com/search?q=vimperator&ie=utf-8&oe=utf-8&num=100

URL 末尾添加的 “num=100” 表示在 Google 在搜索结果页里每一页显示100个结果。这个数字取值范围为1-100,并且需要关闭 「Google 即搜即得联想功能」,如果打开的话,则只能显示10个,因为即搜即得联想功能需要耗费较多的资源。

限定网站地理位置

如果你熟悉 vimperator,大概会知道 vimperator 很多内容都是日语 – 因为有维护者是岛国人民,vimperator 插件的开发者也多是岛国人民。但如果在 Google 以 “vimperator” 为关键词进行搜索,查找出来的结果多是英文,如何限定日语?也许可以考虑打开 Google.co.jp 网站,但仍能找到大量的英文。

这时我们可以通过 “restrict=countryJP” 来限定搜索结果里仅显示服务器地理位置处于日本的站点:

https://www.google.com/search?q=vimperator&ie=utf-8&oe=utf-8&restrict=countryJP

从概率上说,寄放在日本国内的网站很可能是日语站点。这样,我们就离我们的目的更进一步了。

另外,与 restrict=country.. 相近的有 gl=country.. 和 cr=country..,详见扩展阅读2。

限定 Google 界面语言

上一个链接访问的页面里,Google 的菜单等显示的仍是英文,如果也想把它换成日文,则可以如下:

https://www.google.com/search?q=vimperator&ie=utf-8&oe=utf-8&restrict=countryJP&hl=ja

参数 hl(注意是小写的 L,而不是数字1)用于修改 Google 界面语言,简体中文是 zh-cn,台湾正体是 zh-tw,香港繁体则是 zh-hk。当然,这些从左往右阅读的语言可能感觉不到大变化,请加个 hl=iw,希伯来语界面,你就可以看到整个 Google 界面的变化非常大。更多语言代码请见扩展阅读1。

限定语言

在使用 “restrict=countryJP” 时说到一个问题,该参数是通过服务器地址来过滤搜索结果的,但是也有可能其他语言的网站寄存在日本的服务器上。则还有个参数 lr=lang_ja 来限定搜索结果语言为日语。更多语言代码仍是参考扩展阅读1。

限定时间

Google 的搜索工具里提供限定时间(一般是指页面发布的时间)的功能,比如「过去1小时」,「过去24小时」,「过去1周」,甚至是自定义某一段日期。这些功能也可以通过 URL 参数 as_qdr=.. (as 表示 Advanced search)完成。

比如 as_qdr=m2 表示过去两个月,as_qdr=y2 表示过去两年,as_qdr=d2 表示过去两天,as_qdr=s3 表示过去3秒内,w 表示一周,s 表示秒,n 表示分钟,h 表示小时。

URL 参数作用说明表

最末,列个表格说明:

URL 参数取值作用
ie utf-8… 输入编码
oe utf-8… 输出编码
num 1-100 限定一页内显示的数目
restrict countryXX 限定服务器地理
hl en,zh-cn… 设置界面语言
lr lang_en… 限定结果语言
as_qdr s3,n2,h1,d3,w3,m3,y3… 限定网页发布时间
safe on,off 开/关 safe search

更多 URL 参数可以参考文末链接。

谷歌搜索参数url参数详解

标签:

原文地址:http://www.cnblogs.com/hui-blog/p/5158078.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!