码迷,mamicode.com
首页 >  
搜索关键字:term    ( 4383个结果
Lucene40SkipListWriter
多级跳跃表是保存在tim文件里的。tip是term index,tim是term dictionary。记忆方法是,p是pointer因此是term index。这个类会保存多个level的last变量和cur变量,同一时候使用RAMOutputStream数组缓存不同级别跳跃表的内容,一个term...
分类:Web程序   时间:2014-10-26 20:59:48    阅读次数:181
Lucene工具箱之OpenBitSet(一)
3.4Lucene工具箱之OpenBitSet在Lucene中,DocId具有这样的特征:唯一/递增。而且在搜索的过程,不同term之间的DocId集合进行逻辑运算的需求非常之多。OpenBitSet正是集合运算的利器。3.4.1OpenBitSet的原理假设有一个byte,一共有8个二进制位,如下图:0000000001234567如果每..
分类:Web程序   时间:2014-10-25 12:01:04    阅读次数:306
[Erlang 0128] Term sharing in Erlang/OTP 下篇
继续昨天的话题,昨天提到io:format对数据共享的间接影响,如果是下面两种情况恐怕更容易成为"坑", 呃,恰好我都遇到过; 如果是测试代码是下面这样,得到的结果会是怎样?猜!s2()-> L=[1,2,3,4,5,6], L2=[L,L,L,L],erlang:display( {{ert...
分类:其他好文   时间:2014-10-24 09:13:28    阅读次数:191
[Erlang 0127] Term sharing in Erlang/OTP 上篇
之前,在 [Erlang 0126] 我们读过的Erlang论文提到过下面这篇论文:On Preserving Term Sharing in the Erlang Virtual Machine地址:http://user.it.uu.se/~kostis/Papers/erlang12_shar...
分类:其他好文   时间:2014-10-23 20:36:25    阅读次数:200
【分享】oracle set指令的使用
SQL>set colsep ' '; //-域输出分隔符 。SQL>set term {ON|OFF}; //on: 查询结果既显示于假脱机文件中,又在SQLPLUS中显示; off: 查询结果仅仅显示于假脱机文件中。SQL>set echo {ON|OFF}; //设置运行命令是是否显示语句 。...
分类:数据库   时间:2014-10-22 17:15:00    阅读次数:157
Codeforces Round #274 (Div. 2) C. Exams
Student Valera is an undergraduate student at the University. His end of term exams are approaching and he is to pass exactly n exams. Valera is a smart guy, so he will be able to pass any exam he t...
分类:其他好文   时间:2014-10-22 01:09:15    阅读次数:273
Lucene 4.4 根据Int类型字段删除索引
1、方法一,通过Term删除 Term构造中没有,Int类型需要转换成Lucene自带的类BytesRef 。          /**      * 根据商品ID删除索引文件      * @param id      */     public void deleteDocument(int id)     {;         File file = new File("E...
分类:Web程序   时间:2014-10-21 19:43:33    阅读次数:178
语言统计学中的几个定律,可作为设计检索的参考
30定律:出现频率最高的30个词占全文本总词数的30%如果剔除150个最高频率的词(由于df过大被认为是停用词):倒排表记录总个数会减少25-30%Zipf定律: 在自然语料库中所有term的freq(频度)排名和其freq(频度)的乘积大致是一个常数freq_NO1 *1 =freq_NO2 *2...
分类:编程语言   时间:2014-10-19 14:19:16    阅读次数:325
熵的含义
指的是多种成分均匀分布的情况,如果成分分布越均匀,则熵越高,相反则熵越低物理学比如某个物体由多个事物组成,如果各事物所占质量比重均匀,则质量熵就高概率学比如掷色子有6种结果,如果各结果的概率是一样的,则概率熵就高自然语言比如一个term和多个term都有搭配在一起出现的记录,如果各term出现的次数...
分类:其他好文   时间:2014-10-19 14:17:12    阅读次数:185
Facebook图搜索unicorn
unicorn(独角兽),里面类似于倒排链的reference list,对应的term如friend:2,表示entity 2的朋友列表,整个结构是shard的,上面是top aggregator,然后是rack aggreator,支持StrongOr,weakAnd,Difference操作,还有apply(如找朋友的朋友),extract,有个nosql图数据库neo4j也是类似的,只是听...
分类:其他好文   时间:2014-10-18 22:25:29    阅读次数:271
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!