标签:文本 isl index 交集 dex 英文 计算 意义 too
反向索引英文名叫做 Inverted index,顾名思义,是通常意义下索引的倒置。
举个例子: 我们用不同的数字索引不同的句子(比如以下三句在文本中是按照0,1,2的顺序排列的)
0 : "I love you"
1 : "I love you too "
2 : "I dislike you"
如果要用单词作为索引,而句子的位置作为被索引的元素,那么索引就发生了倒置:
"I" : {0,1,2}
"love" : {0, 1}
"you" : {0,1,2}
"dislike" : {2}
如果要检索 "I dislike you" 这句话,那么就可以这么计算 : {0,1,2} ^ {2} ^ {0,1,2} (这里"^"代表交集)
标签:文本 isl index 交集 dex 英文 计算 意义 too
原文地址:http://www.cnblogs.com/yxmfighting/p/7965898.html