IK是solr常用的中文分词,其配置比较难搞,试了好多次才搞定:将jar放入tomcat下WEB-INF/libconfig.xml,ext.dic,stopword.dic放入WEB-INF/classes下另外,solr4+需要使用IK_2012_ff,不要使用IK_2012_u6IK实际的效果...
分类:
其他好文 时间:
2014-07-15 09:52:49
阅读次数:
231
一、被索引的域 Schema.xml
在使用solr对Nutch抓取到的网页进行索引时,schema.xml被改变成以下内容。
文件中指定了哪些域被索引、存储等内容。
<fieldType name="string" class="solr.StrField" sortMissingLast="true"
omitNor...
分类:
其他好文 时间:
2014-07-13 18:56:21
阅读次数:
411
solr4.9发布了,用一个网友的意思,现在solr绝壁是Firefox之外最大的版本帝。公司的solr版本是4.0,这几天决定给升级到4.8(4.9在maven上资源还不够),抽时间在整理下分布式solr. 今天先把solr4.8安装过程写下来,其实和4.0区别不大。1,环境必须是tomcat7....
分类:
其他好文 时间:
2014-07-13 09:55:28
阅读次数:
467
更新了公司的搜索,写下日志来激励自己!新版搜索新特性:solr版本升级到solr4.8.1中文分词器改用ansj,开源,简洁,强大,无害词库兼顾任意编码格式,不怕乱码分词器和分词词库分离,降低更新分词器版本难度分词器配置统一在library.properties中,在solr/WEB-INF/cla...
分类:
其他好文 时间:
2014-07-13 08:04:32
阅读次数:
268
要建立自己的全文检索,一般都需要从数据库导入数据,在原来配置的基础上,增加导入的功能
1、D:\apache-tomcat-7.0.27\solr\conf\solrconfig.xml中增加
Xml代码
requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataIm...
分类:
数据库 时间:
2014-07-11 00:02:02
阅读次数:
376
好吧现在我确定我需要一个搜索引擎了,那么为什么要选Solr呢?公司里各个角色决策的角度不同,元芳,你怎么看?...
分类:
其他好文 时间:
2014-07-10 20:32:14
阅读次数:
244
说了那么多,总结一下Solr的主要功能亮点吧...
分类:
其他好文 时间:
2014-07-10 19:37:15
阅读次数:
214
前段时间开发推荐引擎的时候看了一本好书,搜索引擎相关的概念讲的很清楚很透彻,本着开源共享的精神翻译出来以飨同好...
分类:
其他好文 时间:
2014-07-10 17:48:13
阅读次数:
230
那么到底Solr是个什么样的东西呢?我们通过一个类似于美国搜房网这样一个简单的项目模型,来看看solr的关键特性...
分类:
其他好文 时间:
2014-07-10 17:47:35
阅读次数:
176
本章速揽,以及如何帮助读者判断自己的项目是否需要一个搜索引擎(其实背后的概念就是到底什么样的数据和使用场景适合使用搜素引擎技术捏?又有哪些事情是不适合搜索引擎来做的捏?)...
分类:
其他好文 时间:
2014-07-10 17:42:33
阅读次数:
251