向量空间模型 (或者 词组向量模型) 作为向量的标识符(比如索引),是一个用来表示文本文件的代数模型。它应用于信息过滤、信息检索、索引以及关联规则。SMART是第一个使用这个模型的信息检索系统。
文档和查询都用向量来表示。
每一维都相当于是一个独立的词组。如果这个术语出现在了文档中,那它在向量中的值就非零。已经有很多不同的方法来计算这些值,这些值...
分类:
其他好文 时间:
2014-08-06 19:24:42
阅读次数:
632
http://www.cnblogs.com/king1302217/archive/2010/05/11/1732250.html索引的优点大大加快数据的检索速度,这也是创建索引的最主要的原因索引的缺点 1.创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加 2.索引需要占物理空间2.1...
分类:
数据库 时间:
2014-08-06 14:28:11
阅读次数:
223
所谓PhraseQuery,就是通过短语来检索,比如我想查“big car”这个短语,那么如果待匹配的document的指定项里包含了"big car"这个短语,这个document就算匹配成功。可如果待匹配的句子里包含的是“big black car”,那么就无法匹配成功了,如果也想让这个匹配,....
分类:
其他好文 时间:
2014-08-06 14:25:51
阅读次数:
248
border-radius属性 说明: 设置或检索对象使用圆角边框。提供2个参数,2个参数以“/”分隔,每个参数允许设置1~4个参数值,第1个参数表示水平半径,第2个参数表示垂直半径,如第2个参数 省略,则默认等于第1个参数 水平半径: 如果提供四个参数值,将按上左、上右、...
分类:
Web程序 时间:
2014-08-05 18:32:59
阅读次数:
424
Visual Source Safe 是用于软件专业开发人员的源代码管理工具Team Foundation Server是为开发团队提供集成源代码管理、问题跟踪和进程管理的更改管理系统相同点1.同时开发产品的多个版本2.在不影响其他版本的情况下对产品的一个已发布版本进行更改3.快速检索一批相关文件,...
分类:
其他好文 时间:
2014-08-05 15:33:39
阅读次数:
167
当遇到一个新的知识时,可以通过what-why-how的方式去学习它,下面就通过这种方式去学习下数据库索引。
什么是数据库索引?
定义1:索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。
定义2:索引是与表或视图关联的磁盘上结构,可以加快从表或视图中检索行的速度。索引包含由表或视图中的一列或多列生成的键。这些键存储在一个结构...
分类:
数据库 时间:
2014-08-05 14:08:49
阅读次数:
203
vim有着强大的替换和查找功能,若能进行熟练的运用,可以让工作效率得到一个很大程度的提高.替换语法:[addr]s/源字符串/目的字符串/[option][addr]表示检索范围,如:"1,n":表示从第1行到n行"%":表示整个文件,同"1,$"".,$":表示从当前行到文件尾[addr]省略时表...
分类:
其他好文 时间:
2014-08-05 13:57:09
阅读次数:
193
NIS(NetworkInformationService)是一种分布式命名服务,提供了一种标识和定位网络对象及资源的机制。NIS以使用传输协议且独立于介质的方式为网络范围内的信息提供统一的存储和检索方法。关于它的历史就不过多的介绍了,直接进入正题!本案例基于以下架构:本文搭建NIS域环境使..
分类:
Windows程序 时间:
2014-08-05 03:10:19
阅读次数:
1104
大家都学过数据结构:内存里面为了更好的管理对象,通常采用链表或者数据以及Hash表来存储数据。数据存储 一下是数据存储到计算机的两种模式 线性的存储:数组---寻址方便,更新不好(连续的) 链式的存储: 链表----寻址不方便,更新方便。(不连续的) 为了提高检索的速度,我们可以采取Hash...
分类:
其他好文 时间:
2014-08-05 00:27:38
阅读次数:
182
定义:又称字典树,单词查找树或者前缀树,是一种用于快速检索的多叉树结构,
如英文字母的字典树是一个26叉树,数字的字典树是一个10叉树。
核心思想:是空间换时间.利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。
三个基本性质:
1. 根结点不包含字符,除根结点外每一个结点都只包含一个字符。
2. 从根结点到某一结点,路径上经过的字符连接起来,为该结点对应...
分类:
其他好文 时间:
2014-08-04 17:46:47
阅读次数:
231