码迷,mamicode.com
首页 > 其他好文 > 详细

搜索引擎的使用

时间:2017-07-27 20:24:27      阅读:238      评论:0      收藏:0      [点我收藏+]

标签:不包含   ted   情况   引擎   数字   标题   好的   引号   单词   

# Google搜索技术

搜索引擎只是一个索引数据库,一般没有自己的信息资源,信息的可获得性与搜索引擎无关。不过搜索引擎有时也会在数据库中存储某些信息的内容。      
## 一、普通搜索技术   
### 1、默认模糊搜索、默认拆分语句和过长的短语
- 排除常用词规则:   
>在Google的检索规则中,有些常用词如“的”、“the”或者“of”等这些词是不被当作检索词的,而被忽略掉。
      
- 不区分大小写规则:
>Google对于检索词中的大小写是完全不做区分的,这个规则的设置是为了改善检索结果,因为利用这样一个规则,就可以检索到包含该词的所有网页,避免了因为大小写不规范而造成的在查全率上的损失

- 排除标点符号规则:     
>Google并不认为标点符号具有与文字一的重要地位,因此Google会忽略检索之间绝大多数的标点符号。但是对于单引号和连字符而言,它们是不被省略的。    

- 检索词的词序和邻近规则:
>在Google中,检索词的排序方式对于整个检索式具有重要的影响,它将首先匹配按照检索式给出的次序进行搜索。同时它也将优先匹配检索词相互邻接的网页。     
### 2、精确搜索:双引号“”。(短语搜索。可以查到各个单词按相同顺序出现的网页)  
### 3、通配符*用法   
### 4、点号匹配任意字符(也可不用引号)
### 5、布尔逻辑
- 逻辑与:空格、AND。    
(在Google的检索规则中,最基本的一条是默认And规则,即当你输入多个检索词之后,Google默认为要检索所有的包含所有检索词的网页,它们之间为And连接。)
- 逻辑或:OR       
在检索式中运算符OR必须以大写的形式出现,否则会把它看成是普通的检索词。OR运算符告诉Google查找包含其中任何一个词的网页。       
- 逻辑非:-(减号)。         
运算符“-”表示不包含该运算符后面的词。
### 6、约束条件:+。(运算符“+”表示包含运算符后面的词)
### 7、同义词:~(英文适用。运算符“~”让Google检索该词及其同义词)
### 8、数字范围:..
## 二、高级搜索语法
### 1、intitle、allintitle:搜索范围限制在网页的标题
### 2、intext,allintext:搜索范围限制在网页中的正文中搜索,即忽略超链接文本、URL以及题目等。
### 3、inurl、allinurl:搜索范围限制在URL。
### 4、inanchor、allinanchor :搜索范围限制在页面的链接锚点进行搜索,即在一个链接的描述文本内进行检索。网页中的代码<a href="#A1">网页第一部分</a>。
### 5、info:进入某URL更多信息的引导页面。
     cache:搜索谷歌缓存的页面
     related:检索与某特定网页类似的网页。这在搜寻相关内容或者具有类似功能的网页的时候,非常有帮助。
     link:搜索所有链接到某个特定 URL上的页面列表
     site:搜索范围限制在某网站或者顶级域名中。
### 6、filetype:根据文件后缀搜索特定文件类型
### 7、define:搜索定义
### 8、谷歌高级搜索语法也可以通过“高级搜索”页面来实现部分功能,不过,直接用高级搜索语法能更方便、更灵活、更高效。
Daterange:查找在一定的日期或者一定的日期范围内,Google索引的网页(该语法只关注被Google收录的时间,而不关注网页创建的时间)。
## 三、混合使用搜索技术
### 1、混合使用技术
- 缩小搜索范围最好的选择:混合使用intitle、site。例如,intitle:自动化site:edu.cn;
- 限定搜索特定类别的信息:inurl限定。例如,等爱的玫瑰  inurl:mp3;
- 搜索网站内的文档(一网打尽!):例如,filetype:ppt  site:lib.nit.net.cn。
### 2、什么情况下不混合使用
- 不混合使用有抵消的搜索:例如,知识管理site:edu.cn  -inurl:edu;
- 不要重复使用同一语法结构:例如,知识管理  site:cn site:com,但是这样可以:知识管理  (site:cn  | site:com);
- 在混合使用语法时,不要用别名:如allinurl、allintitle;
- 不要使用过多的语法将搜索结果限制得特别狭窄,采取逐步增加限制的方法,一般不要一步到位做很多限制。

## 四、Google提供的特色服务
1. Google 学术搜索:学术文章搜索,可能会获得全文。http://scholar.google.cn/ 
2. Google 图片搜索:搜索图片,对做课件和艺术系同学很有帮助。http://images.google.cn/网
3. Google 图书搜索:有可能获得所需要图书的全文。 http://books.google.cn/ 
4. Google 地图搜索:查询地址、捜索周边和规划路线。http://ditu.google.cn/
5. Google 地球:从远、近等多个角度查看地球的各个角落。http://earth.google.com 
6. Google 视频:从远、近等多个角度查看地球的各个角落。http://video.google.com
## 五、Google搜索时应注意的问题
- Google不区分英文字母的大小写,所有字母均作小写对待。例如:输入“george washington”(乔治·华盛顿),或是“George Washington”, 再或是“gEoRgE wAsHiNgToN”,结果都是一样的
- 通配符问题。Google对通配符的支持有限,只能用“*”代替单个字符,而且必须将检索词用引号引起来,如“以*治国”
- 搜索引擎忽略的字符与强制检索。
Google对一些出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。如果检索词中包含这些字符,必须进行强制检索,在这些字符前后用“+”,如“+www+的历史”,或用英文的引号

搜索引擎的使用

标签:不包含   ted   情况   引擎   数字   标题   好的   引号   单词   

原文地址:http://www.cnblogs.com/q735613050/p/7246576.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!