一、Lucene搜索过程总论搜索的过程总的来说就是将词典及倒排表信息从索引中读出来,根据用户输入的查询语句合并倒排表,得到结果文档集并对文档进行打分的过程。其可用如下图示:总共包括以下几个过程:IndexReader打开索引文件,读取并打开指向索引文件的流。用户输入查询语句将查询语句转换为查询对象Q...
分类:
其他好文 时间:
2014-08-05 15:31:19
阅读次数:
281
1、今天试验SlopeOne推荐算法,结果没有提示。心想是不是少了jar包,查查不少。通过网络查询定位此类所在的位置为:org.apache.mahout.cf.taste.impl.recommender.slopeone.包下面,所以去查看jar包,发现没有。查看src包也没有这个类的源码,之后...
分类:
其他好文 时间:
2014-08-05 14:04:09
阅读次数:
231
solrj中配置:两种高亮开启设置// solrParams.setHighlight(true);solrParams.setParam("hl","true");//highlighting设置高亮字段: //高亮参数设置 那些字段高亮显示,可以用空格或者逗号分隔 solrParams.addH...
分类:
其他好文 时间:
2014-08-05 13:51:29
阅读次数:
317
花了一段时间学习lucene今天有时间把所学的写下来,网上有很多文章但大部分都是2.X和3.X版本的(不前最新版本4.9),希望这篇文章对自己和初学者有所帮助。
学习目录
(1)什么是lucene
(2)lucene常用类详解
(3)lucene简单实例
(4)lucene常用分词器
(5)lucene多条件查询
(6)修改删除索引
(7)lucene优化、排序
(8)lu...
分类:
其他好文 时间:
2014-08-03 18:07:35
阅读次数:
352
前言:配置mahout花了挺多时间的,主要是在一些小的问题上浪费了很多时间。1.下载mahout 下载地址:http://mahout.apache.org 我下载的最新版:mahout-distribution-0.92.把mahout解压到你想存放的文档,我是放在/Users/jia/Docu....
分类:
其他好文 时间:
2014-08-03 15:11:55
阅读次数:
415
首先将下载解压后的solr-4.9.0的目录里面找到lucene-analyzers-smartcn-4.9.0.jar文件,将它复制到solr的应用程序里面D:\apache-tomcat-7.0.54\webapps\solr\WEB-INF\lib,备注:网上很多文章使用IK中文分词器(IK_...
Hadoop源起与体系概述 Hadoop的源起——Lucene Lucene是Doug Cutting开创的开源软件,用java书写代码,实现与Google类似的全文搜索功能,它提供了全文检索引擎的架构,包括完整的查询引擎和索引引擎早期发布在个人网站和SourceForge,2001年年底成为apache软件基金会jakarta的一个子项目 Lucene的目的是为软件开发人员提供一个简单易用的工具...
分类:
其他好文 时间:
2014-08-01 23:09:52
阅读次数:
388
今天 我将讲讲网络通讯,这里我初始版本 由于采用的事Netty框架 ?所以 这里讲网络Netty在我们这里是怎么使用的,下周开始添加rpc lucene内容了 实现之后的0.2 0.3版本,后面将会去掉netty依赖 采用原生的NIO2 ...
分类:
Web程序 时间:
2014-08-01 00:18:01
阅读次数:
596
在使用Lucene时,有一条建议”不要频繁去打开关闭硬盘索引”。为什么会有这条建议?这就需要在IndexReader的实例化过程中找答案。先说一个结论“IndexReader的实例化过程是一个非常耗时的过程”。由于IndexReader只是一个抽象类,在调用代码:真正得到的是StandardDirectoryRea..
分类:
其他好文 时间:
2014-07-31 17:22:17
阅读次数:
226
一、AOP框架 Encase 是C#编写开发的为.NET平台提供的AOP框架。Encase 独特的提供了把方面(aspects)部署到运行时代码,而其它AOP框架依赖配置文件的方式。这种部署方面(aspects)的方法帮助缺少经验的开发人员提高开发效率。 NKalore是一款编程语言,它扩展了C#允...
分类:
其他好文 时间:
2014-07-31 13:14:36
阅读次数:
354