码迷,mamicode.com
首页 > 其他好文 > 详细

其他 - 简述 反向索引

时间:2019-12-10 13:06:37      阅读:83      评论:0      收藏:0      [点我收藏+]

标签:输入   使用   word   hat   pre   his   字典   思路   位置   

1. 概述

  1. 概述
    1. 简述 反向索引
    2. 也有人叫 倒排索引
  2. 场景
    1. 经常会出现在 搜索引擎 的后面

2. 生活中的索引

  1. 目录
    1. 格式

      # 章节内容在哪一页
      <content> -> <page>
    2. 字典

      # 单词在哪一页
      <word> -> <page>
  2. 思路
    1. 内容 在 哪个位置

3. 搜索引擎生成 倒排索引 的内容

  1. 英文 索引 生成
    1. 输入
      1. 文本
    2. 过滤
      1. 例如 html 标签
    3. 分词
      1. 时态
      2. 单复数
    4. 过滤
      1. 过滤一些没哈用的词
        1. 比如: a, an, the, this, that
    5. 输出
      1. 正向索引
    6. 生成 反向索引

4. 正向索引

  1. 概述
    1. 生成索引时第一轮的输出
  2. 名称由来
    1. 首先输出, 所以叫正向
    2. 反向索引
      1. 基于正向索引而来, 所以叫反向
      2. 其实就是普通的索引
        1. 标记 内容 在 某个位置
  3. 形式

    Doc1 -> the, cow, says, moo
    Doc2 -> the, cat, and, the, the, hat
    Doc3 -> the, dish, ran, away, with, the, spoon

5. 反向索引

  1. 概述
    1. 搜索引擎使用的最终结果
    2. 实际的思路, 就是 普通索引
      1. 就是 字典里那种
  2. 名称由来
    1. 正向索引
    2. 正向索引反过来

其他 - 简述 反向索引

标签:输入   使用   word   hat   pre   his   字典   思路   位置   

原文地址:https://www.cnblogs.com/xy14/p/12015815.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!