本文主要介绍了在短语、句子、多词查询中,solr在控制查询命中数量、之后再对结果集进行排序。
如何合理的控制solr查询的命中的数量和质量???
在上篇文章中,提到了两种关于solr 对短语、短句(非关键词)的搜索精度解决方案,solr控制多词联合查询命中的数量。
但是上面解决了返回精度的问题。但是设置mm匹配精度 或者全词匹配defaultOperator=“AND”。df和qf 自定义的排序 就不起作用了。...
分类:
编程语言 时间:
2015-08-17 19:40:24
阅读次数:
3304
问题背景搜索关键字智能提示是一个搜索应用的标配,主要作用是避免用户输入错误的搜索词,并将用户引导到相应的关键词上,以提升用户搜索体验。美团CRM系统中存在数以百万计的商家,为了让用户快速查找到目标商家,我们基于solrcloud实现了商家搜索模块。用户在查找商家时主要输入商户名、商户地址进行搜索,为了提升用户的搜索体验和输入效率,本文实现了一种基于solr前缀匹配查询关键字智能提示(Suggesti...
分类:
其他好文 时间:
2015-08-15 23:06:15
阅读次数:
179
在师出名门的基于lucene的solr搜索引擎中。提供了 拼写检查和智能提示这块功能。
拼写检查就是用来检查用户输入的检索内容是否存在,如果不存在则,给它提示出相近,或相似的内容。
而检索建议则是用户输入某个检索条件后,会立刻友好的给出一系列提示内容,并推荐首个出现的相似的词,作为推荐词。
也就是说 拼写检查是可以作为一个单独功能使用,但suggest一般引用拼写检查组件...
分类:
其他好文 时间:
2015-07-02 22:44:56
阅读次数:
223
在中文搜索中的标点、符号往往也是有语义的,比如我们要搜索“C++”或是“C#”,我们不希望搜索出来的全是“C”吧?那样对程序员来说是个噩梦。然而在中文分词工具mmseg中,它的中文分词是将标点与符号均去除的,它认为对于中文来讲标点符号无意义,这明显不能满足我们的需求。那么怎样改造它让它符合我们的要求...
分类:
其他好文 时间:
2015-05-14 00:53:54
阅读次数:
234
环境:
Ubuntu 12.04 Solr 5.1.0 MongoDB db version:v2.0.4
1. Solr配置与MongoDB的安装
Solr安装配置到目前已经非常简单,参考官方文档:http://lucene.apache.org/solr/quickstart.html,官方文档中用的是cloud这个example,最后,我采用的是techproducts,基...
分类:
数据库 时间:
2015-05-07 14:35:04
阅读次数:
174
Solr的schema.xml默认配置分词后条件取 OR例如:大众1.6T系统会自动分词为 【大众】 【1.6T】(ps:不同分词器分词效果不同) 会搜索出包含 【大众 OR 1.6T】 的结果。想要让Solr搜索默认为 【大众 AND 1.6T】则只需要修改solr\collection1\c.....
分类:
其他好文 时间:
2015-04-24 00:40:55
阅读次数:
221
1. Overview of Searching in Solr 在用户运行一个solr搜索时,搜索查询会被request handler处理.一个request handler就是一个请求处理插件,这个插件定义了在solr处理请求时的请求处理逻辑 .solr支持多种request handler....
分类:
其他好文 时间:
2015-03-09 16:02:46
阅读次数:
197
以下程序使用solr作为搜索模块,搜索关键的第一步是创建索引。索引的产生我们一般是通过数据库中的数据作为数据源。但是数据库中的数据是时时变化的,数据库的数据变化了怎么同步索引到solr呢。以下程序就是解决这个问题。mongo数据库发生变化后通过使用github上开源的项目mongo-connector作为工具,该项目可以时时检测数据库的改变从而和solr配合实现同步索引的目的。
一:配置...
分类:
数据库 时间:
2015-03-08 00:08:10
阅读次数:
303
solr创建索引、添加数据的关键是配置schema.xml文件,该文件中主要是完成配置数据源、索引字段、数据类型等定义。同时,该文件的配置直接影响到solr搜索的效率和准确性。
一、搜索类型FileType
name:指的是FileType的名字
class:指向org.apache.solr.analysis包里面对应的class名称,用来定义这个类型的行为
...
分类:
其他好文 时间:
2015-02-09 14:17:48
阅读次数:
260
最近在查一些关于Solr里面比较深入具体的资料的时候,发现网上的很多资料要么是简单的相互拷贝,要么就是英文资料。总是感觉不那么得心应手之余,有些东西自己还是得去看solr wiki或者查看源代码。也希望自己的一点小小的研究,能给学习应用solr,lucene或者WCS的朋友们一点小小的参考。另外,对互联网和电子商务比较感兴趣的朋友也能对电子商务网站的开发过程有个大致的了解。...
分类:
其他好文 时间:
2015-01-04 12:12:28
阅读次数:
253