[文章作者:张宴 本文版本:v1.0 最后修改:2008.12.09 转载请注明原文链接:http://blog.zyan.cc/post/385/] 曾经在七月,写过一篇文章──《基于Sphinx+MySQL的千万级数据全文检索(搜索引擎)架构设计》,前公司的分类信息搜索基于此架构,效果明显,甚....
分类:
其他好文 时间:
2014-07-16 19:01:06
阅读次数:
326
轻松为应用程序构建搜索和索引功能本文将探讨 Apache Lucene —— 性能卓越、功能全面的文本搜索引擎库。我们将学习 Lucene 架构及其核心 API。学习如何使用 Lucene 进行跨平台全文本搜索、建立索引、显示结果,以及如何扩展搜索。
分类:
其他好文 时间:
2014-07-16 15:59:17
阅读次数:
229
lucene构建restful风格的简单搜索引擎服务...
分类:
其他好文 时间:
2014-07-16 13:03:55
阅读次数:
244
Solr是Apache Lucene的一个子项目。Lucene为全文搜索功能提供了完备的API,但它只作为一个API库存在,而不能直接用于搜索。因此,Solr基于Lucene构建了一个完整的搜索引擎,它可以为搜索引擎添加文档,对文档内容进行分析,并为用户提供搜索功能,在此基础上提供了一个扩展功能,如hit highline, suggetion等。
一、概述
(一)...
分类:
其他好文 时间:
2014-07-16 11:08:00
阅读次数:
222
IK Analyzer 3.0特性采用了特有的"正向迭代最细粒度切分算法",具有80万字/秒的高速处理能力采用了多子处理器分析模式,支持:英文字母(IP地址、Email、URL)、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理。优化的词典存储,更小的内存占用...
分类:
其他好文 时间:
2014-07-16 00:54:37
阅读次数:
800
从各个角度总结了电商平台中的架构实践,由于时间仓促,定了个初稿,待补充完善,欢迎大家一起交流。转载请声明出处:http://blog.csdn.net/yangbutao/article/details/12242441作者:杨步涛关注分布式架构、大数据、搜索、开源技术QQ:306591368技术B...
分类:
其他好文 时间:
2014-07-15 23:51:01
阅读次数:
669
引言 最近LZ带头在做一个互联网项目,互联网的东西总是那么新鲜,这也难怪大部分猿友都喜欢互联网。这个互联网项目不仅让LZ开发了一个HBase大数据应用,近期的一次需求讨论会上,又出来一个小需求,蛮有意思的。这些需求在之前枯燥的企业内部应用开发中,还是很难见到的,毕竟内部应用更多的是业务流程的体现。....
分类:
其他好文 时间:
2014-07-13 19:13:57
阅读次数:
266
在lucene里面,suggest 的支持非常完善,可以随心所欲的定制;但是在es中使用起来就没有那么方便了。es给suggest 分类4类:term ;phrase; completion; context;目前最新版本是es1.2.1 这一块也还在不断完善中;[term suggester](....
分类:
其他好文 时间:
2014-07-13 13:04:41
阅读次数:
1433
近期做项目中有用到过Lucene,那个模块是由一位前端大神负责的,空闲时间我也做了个关于Lucene做全文检索的Demo,记录下来,方便以后学习。
关于Lucene的原理,网上有长篇大论的文章,有兴趣的话可以去阅读,再次我就直奔主题,在代码中分析其原理。
1、创建索引(此处我用的是盘古分词)
注:在后台代码的第一行上加上 #define notes这样一行代码,目的是可以用外侧代码的#if,...
分类:
Web程序 时间:
2014-07-12 23:52:43
阅读次数:
509
今天来写写搜索,现在做的这个项目中涉及到了很多的搜索大部分是我做的,有次经理问我有没有用过luence这个搜索引擎,这个还真没有用过只是听说过有这么个搜索工具包,一直没有接触过,利用做项目空闲的时间也在逐渐了解搜索方面的东西,对搜索也重新认识了一下觉得搜索方向还是很值得我们研究和应用的。
在学习方面有时选择好一个正确的学习方向是比较重要的,在我们学的过程中米老师给我指明了方向所以你不...
分类:
其他好文 时间:
2014-07-12 23:37:55
阅读次数:
214