在 Google 搜索里,有许多高级的「搜索设置」,比如屏蔽不需要的结果(Blocking unwanted results),开/关 Google 即搜即得联想功能(Google Instant predictions),设置「每页搜索结果数」等。
同时,这些设置也可以通过修改 Google 查询的 URL 参数来完成,并且灵活性比上述的「搜索设置」更高。
设定输入输出编码
先来看一个最简单的 Google 查询 URL:
https://www.google.com/search?q=vimperator&ie=utf-8&oe=utf-8
这个 URL 的意思是在 Google 中搜索 “vimperator”,且输入编码(ie – input encoding)为 utf-8,输出编码(oe – output encoding)也为 utf-8。
限定显示结果数目
一般来说,搜索引擎在一页里显示10个结果,Google 里这个数目可以通过「搜索设置」调整为10、20、30、40、50、100,但我们也可以通过 URL 参数来做更多的调整。
仍举上面那个 URL 为例:
https://www.google.com/search?q=vimperator&ie=utf-8&oe=utf-8&num=100
URL 末尾添加的 “num=100” 表示在 Google 在搜索结果页里每一页显示100个结果。这个数字取值范围为1-100,并且需要关闭 「Google 即搜即得联想功能」,如果打开的话,则只能显示10个,因为即搜即得联想功能需要耗费较多的资源。
限定网站地理位置
如果你熟悉 vimperator,大概会知道 vimperator 很多内容都是日语 – 因为有维护者是岛国人民,vimperator 插件的开发者也多是岛国人民。但如果在 Google 以 “vimperator” 为关键词进行搜索,查找出来的结果多是英文,如何限定日语?也许可以考虑打开 Google.co.jp 网站,但仍能找到大量的英文。
这时我们可以通过 “restrict=countryJP” 来限定搜索结果里仅显示服务器地理位置处于日本的站点:
https://www.google.com/search?q=vimperator&ie=utf-8&oe=utf-8&restrict=countryJP
从概率上说,寄放在日本国内的网站很可能是日语站点。这样,我们就离我们的目的更进一步了。
另外,与 restrict=country..
相近的有 gl=country..
和 cr=country..
,详见扩展阅读2。
限定 Google 界面语言
上一个链接访问的页面里,Google 的菜单等显示的仍是英文,如果也想把它换成日文,则可以如下:
https://www.google.com/search?q=vimperator&ie=utf-8&oe=utf-8&restrict=countryJP&hl=ja
参数 hl
(注意是小写的 L,而不是数字1)用于修改 Google 界面语言,简体中文是 zh-cn
,台湾正体是 zh-tw
,香港繁体则是 zh-hk
。当然,这些从左往右阅读的语言可能感觉不到大变化,请加个 hl=iw
,希伯来语界面,你就可以看到整个 Google 界面的变化非常大。更多语言代码请见扩展阅读1。
限定语言
在使用 “restrict=countryJP” 时说到一个问题,该参数是通过服务器地址来过滤搜索结果的,但是也有可能其他语言的网站寄存在日本的服务器上。则还有个参数 lr=lang_ja
来限定搜索结果语言为日语。更多语言代码仍是参考扩展阅读1。
限定时间
Google 的搜索工具里提供限定时间(一般是指页面发布的时间)的功能,比如「过去1小时」,「过去24小时」,「过去1周」,甚至是自定义某一段日期。这些功能也可以通过 URL 参数 as_qdr=..
(as 表示 Advanced search)完成。
比如 as_qdr=m2
表示过去两个月,as_qdr=y2
表示过去两年,as_qdr=d2
表示过去两天,as_qdr=s3
表示过去3秒内,w
表示一周,s
表示秒,n
表示分钟,h
表示小时。
URL 参数作用说明表
最末,列个表格说明:
URL 参数 | 取值 | 作用 |
---|---|---|
ie | utf-8… | 输入编码 |
oe | utf-8… | 输出编码 |
num | 1-100 | 限定一页内显示的数目 |
restrict | countryXX | 限定服务器地理 |
hl | en,zh-cn… | 设置界面语言 |
lr | lang_en… | 限定结果语言 |
as_qdr | s3,n2,h1,d3,w3,m3,y3… | 限定网页发布时间 |
safe | on,off | 开/关 safe search |
… | … | … |
更多 URL 参数可以参考文末链接。