说到分组统计估计大家都不会陌生,就是数据库的group
by语句,但是当我们采用solr4.5全文检索时,数据库提供再好的sql语句都没有任何的意义了,那么在solr4.5中我们如何做到分组统计呢?其实很简单,下面我们来看看怎么做。示例场景:
现在有个电子商务网站的产品搜索功能,不同的商家发布...
分类:
其他好文 时间:
2014-05-12 00:08:28
阅读次数:
421
走上了程序员这条道路,必须了解大量的技术体系,程序是一个开源的世界,这是一种幸运也是一种不幸,在能无偿了解这么多知识的同时,我们也必须了解如此大量的知识才能成为合格的程序员。...
分类:
编程语言 时间:
2014-05-11 05:09:51
阅读次数:
331
请批判性的学习,欢迎大牛指正错误1、有关PHP字符串的说法,不对的是:C(编码方式不同,substr()操作中文的时候会乱码)A、如果一个脚本的编码是
ISO-8859-1,则其中的字符串也会被编码为 ISO-8859-1。B、PHP的字符串在内部是字节组成的数组,用花括号访问或修改字符串对多字节字...
分类:
Web程序 时间:
2014-05-10 22:25:48
阅读次数:
494
一、概述分表是个目前算是比较炒的比较流行的概念,特别是在大负载的情况下,分表是一个良好分散数据库压力的好方法。首先要了解为什么要分表,分表的好处是什么。我们先来大概了解以下一个数据库执行SQL的过程:接收到SQL
–> 放入SQL执行队列 –> 使用分析器分解SQL –> 按照分析结果进行数据的提取...
分类:
其他好文 时间:
2014-05-10 07:27:19
阅读次数:
372
Zoie中有个ZoieMergePolicy应该价值不大,这是针对lucene早期版本中merge时不考虑删除的doc占比而做的改进,和LogMergePolicy一样也是只做相邻段的合并,合并时使用...
分类:
其他好文 时间:
2014-05-10 04:43:05
阅读次数:
304
同事调整了IndexWriterConfig的maxThreadStates参数,发现性能有很大提升,原来之前一直没去注意这个东西。
addDocument时默认会调用ThreadAffinityDocumentsWriterThreadPool来获取线程锁,而这个线程池默认是8个线程,如果同时addDocument的线程多于8个,则线程处在等待锁的状态(一般是等最小竞争的>锁),所以本质上...
分类:
其他好文 时间:
2014-05-10 04:33:12
阅读次数:
210
其特点是给定的段列表顺序归并,不像TieredMergePolicy那样按大小排序之后决定。
norm = log(10),levelFloor=log(minMergeSize)/norm,对段列表中的元素,添加level值为log(size)/norm(即使log 10 size)的seg。
从列表位置0开始,取最大的logLevel为maxLevel,levelBottom=(float...
分类:
其他好文 时间:
2014-05-10 03:50:37
阅读次数:
306
Lucene 4.8开始不支持java6了,所以在下次版本升级之前我们要先升级至java7。
我使用1/3的全量索引(7.3G),进行测试,20并发,40万请求:
sun jdk 1.6.0_26 平均响应时间为9.08ms
sun java 7 update 55 平均响应时间为8.29ms
传说中的g1 garbage collector那么高大上,使用G1之...
分类:
编程语言 时间:
2014-05-10 03:29:28
阅读次数:
350
http://blog.csdn.net/accesine960/article/details/80668772012年10月12日,Lucene
4.0正式发布了(点击这里下载最新版),这个版本因为诸多的新特性和大胆的架构调整一直备受期待。无论是索引结构,索引算法以及整体架构的包容性都发生了翻天...
分类:
其他好文 时间:
2014-05-09 15:47:06
阅读次数:
321
对这个课程有兴趣的朋友,可以加我的QQ2059055336和我联系,可以和您分享。
课程介绍:最有前途的软件开发技术——搜索引擎技术
搜索引擎作为互联网发展中至关重要的一种应用,已经成为互联网各个领域的制高点,其重要性不言而喻。搜索引擎领域也是互联网应用中不多见的以核心技术作为其命脉的领域,搜索引擎各个子系统是如何设计的?这成为广大技术人员和搜索引擎优化人员密切关注的内容。
随着互...
分类:
其他好文 时间:
2014-05-09 15:24:17
阅读次数:
322