码迷,mamicode.com
首页 > 其他好文 > 详细

倒排索引原理

时间:2015-03-29 22:17:03      阅读:450      评论:0      收藏:0      [点我收藏+]

标签:索引   搜索引擎   结构   技术   

这里介绍一个基础的搜索引擎技术

假如有两段文字

1,books and friends should be few but good

2,A good book is a good friend

假如我们忽略掉大小写和复数,可以整理出一张单词表,显示哪个单词再哪段文字,

英文单词 文章编号
a 2
and 1
be 1
book 1,2

有了这样一张表,就可以短时间内根据给定单词找到对应的文章。由于单词是有序的,查找效率很高,
索引的通用结构是:

次关键码:例如上面的英文单词

记录号表,例如上面的文章编号


其中记录号表存贮具有相同次关键字的所有记录的记录号

倒排索引原理

标签:索引   搜索引擎   结构   技术   

原文地址:http://blog.csdn.net/susser43/article/details/44731189

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!