这是之前Lucene3.0生成的索引格式a表b表、c.这是网上找的图片(因为上面的两张表的segment都是合并了的)lucene4.9 建立的索引: 索引(Index): 在Lucene中一个索引是放在一个文件夹中的。 如上图,同一文件夹中的所有的文件构成一个Lucene索引。 段(Segment...
分类:
其他好文 时间:
2014-07-16 22:49:44
阅读次数:
211
概念性的:只能处理字符串,属于全文搜索引擎(站内),数据库把词条给lucence然后查找的时候在lucence中查找其它的搜索技术如like%%模糊查询模糊程度太低,无法匹配几个关键词不挨着的;造成全表扫描,效率低数据库全文索引需要在数据库中开启,效率可以但是模糊率不行数据库全文检索很傻瓜化,和普通...
分类:
Web程序 时间:
2014-07-16 21:01:39
阅读次数:
379
最近要处理后台的文件检索,于是在老大的指导下知道了有lucene这种牛B的开源文件检索引擎,于是来学学,lucene得用java开发,所以很明显首先得把环境搭建好,哈哈当然先搭建linux下java了。说到java我又想说说我之前配置java环境变量的时候,老是把jre和jdk混淆了,现在是理清了,...
分类:
编程语言 时间:
2014-07-16 19:33:50
阅读次数:
238
solr4.9发布了,用一个网友的意思,现在solr绝壁是Firefox之外最大的版本帝。公司的solr版本是4.0,这几天决定给升级到4.8(4.9在maven上资源还不够),抽时间在整理下分布式solr. 今天先把solr4.8安装过程写下来,其实和4.0区别不大。1,环境必须是tomcat7....
分类:
其他好文 时间:
2014-07-13 09:55:28
阅读次数:
467
解决 Twitter的“问题”就像玩玩具一样,这是一个很有趣的扩展性比喻。每个人都觉得 Twitter很简单,一个菜鸟架构师随便摆弄一下个可伸缩的 Twitter就有了,就这么简单。然而事实不是这样, Twitter的工程副总裁 Raffi Krikorian细致深入的描述了在 Twitter在可伸...
分类:
其他好文 时间:
2014-07-13 09:32:28
阅读次数:
279
深入学习ExtJs4.1的布局及常用控件http://edu.ibeifeng.com/view-index-id-129.html专题-深入JavaOOP编程http://edu.ibeifeng.com/view-index-id-88.html案例:Red5&Flex聊天室架构与实现http:...
分类:
编程语言 时间:
2014-07-11 22:35:07
阅读次数:
242
搜索引擎技术之概要预览前言 近些天在学校静心复习功课与梳理思路(找工作的事情暂缓),趁闲暇之际,常看有关搜索引擎相关技术类的文章,接触到不少此前未曾触碰到的诸多概念与技术,如爬虫,网页抓取,分词,索引,查询,排序等等,更惊叹于每一幅精彩的架构图,特此,便有记录下来的冲动,以作备忘。 本文从最主要.....
分类:
其他好文 时间:
2014-07-09 20:04:15
阅读次数:
200
一、利用SolrJ操作solr API 使用SolrJ操作Solr会比利用httpClient来操作Solr要简单。SolrJ是封装了httpClient方法,来操作solr的API的。SolrJ底层还是通过使用httpClient中的方法来完成Solr的操作。 需要的包如下: 1、 apac...
分类:
其他好文 时间:
2014-07-08 22:33:00
阅读次数:
441
l全文检索(Full-Text
Retrieval)是指以文本作为检索对象,找出含
有指定词汇的文本。全面、准确和快速是衡量全文检索系统的关键指
标。
l关于全文检索,我们要知道:
1,只处理文本。
2...
分类:
其他好文 时间:
2014-07-08 16:31:05
阅读次数:
183