标签:全文检索
当前版本仅限于solr-4.10.2版本。默认环境使用的是jdk1.7,tomcat7.环境自己配置。网上一堆堆的。
1、下载相应的文件(solr-4.10.2.zip)。
官网地址:http://lucene.apache.org/solr/
2、将solr-4.10.2.zip文件解压.例:F:\solr-4.10.2
3、找到F:\solr-4.10.2\example目录中的solr文件,复制一份至硬盘中,并改名为solrHome(F:\solrHome)。
4、找到F:\solrHome目录下的collection1文件,更改名称为solrAricle,打开F:\solrHome\solrAricle文件夹,找到core.properties文件,打开将name=collection1更改为name=solrAricle
5、找到F:solrHome\solrAricle\conf\solrconfig.xml文件,打开删除以下信息:
<lib dir="../../../contrib/extraction/lib" regex=".*\.jar" />
<lib dir="../../../dist/" regex="solr-cell-\d.*\.jar" />
<lib dir="../../../contrib/clustering/lib/" regex=".*\.jar" />
<lib dir="../../../dist/" regex="solr-clustering-\d.*\.jar" />
<lib dir="../../../contrib/langid/lib/" regex=".*\.jar" />
<lib dir="../../../dist/" regex="solr-langid-\d.*\.jar" />
<lib dir="../../../contrib/velocity/lib" regex=".*\.jar" />
<lib dir="../../../dist/" regex="solr-velocity-\d.*\.jar" />
6、F:\solr-4.10.2\dist文件夹中的solr-4.10.2.war文件复制到TOMCAT发布目录下(F:\Tools\tomcat-7.0.47\webapps)目录下。改名为solr.war
7、启动tomcat,此时tomcat会把solr.war进行解压,生成一个solr文件夹;停止tomcat,删除solr.war。
8、用编辑器打开tomcat下面的solr/WEB-INF/web.xml,找到下面的代码:
<!--
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/put/your/solr/home/here</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
-->
打开注释,修改<env-entry-value>/put/your/solr/home/here</env-entry-value>里面的值
即将/put/your/solr/home/here修改成F:\solrHome。
9、根据第五条中删除的jar包配置文件,找到对应的jar包复制到F:\Tools\tomcat-7.0.47\webapps\solr\WEB-INF\lib目录中。
1)F:/solr-4.10.2/example/ib/ext/*.jar
2)F:/solr-4.10.2contrib/extraction/lib/*.jar
3)F:/solr-4.10.2contrib/clustering/lib/*.jar
4)F:/solr-4.10.2contrib/langid/lib/*.jar
5)F:/solr-4.10.2contrib/velocity/lib/*.jar
6)F:/solr-4.10.2dist/目录下的(\d.*\代表版本号如:solr-cell-\d.*\.jar代表solr-cell-4.10.2.jar)
solr-cell-\d.*\.jar
solr-clustering-\d.*\.jar
solr-langid-\d.*\.jar
solr-velocity-\d.*\.jar
11、建立索引字段。
打开F:\solrHome\solrAricle\conf目录下的schema.xml配置文件,添加索引字段。
name:属性名称
type:类型 (可以指定分词器) 如果是数据类型要和前台的字段类型一致,如int类型不能为String类型
indexed:是否被索引
stored:是否存储
针对field类型的数据仅保留下面三条就可以。其他的索引字段随意加。
<field name="_version_" type="long" indexed="true" stored="true"/>
<field name="_root_" type="string" indexed="true" stored="false"/>
<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />
//这个是设置ID的必须唯一
<uniqueKey>id</uniqueKey>
12、分词器设置:可以使用paoding或者IK
一、IK配置
1)、导入jar包:IKAnalyzer2012FF_u1.jar
2)、在src根目录放入下面两个文件夹:
stopword.dic --过滤掉的词汇,没事可以加一些。
IKAnalyzer.cfg.xml --stopword.dic中的文件
3)、找到F:\solrHome\solrAricle\conf目录下的schema.xml文件,在后面加入下面这句话:
<!-- IKAnalyzer分词 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer">
</analyzer>
</fieldType>
4)、完成
分词器设置成功之后。修改步骤11中的分词字段的类型即可。
例:<field name="content" type="text_ik" indexed="true" stored="true"/>
二、paoding配置 参考分词器庖丁。 懒着试了。paoding 已经不更新了。
13、字段建立索引配置。
1)、将jdbc驱动ojdbc14-10.2.0.4.0.jar、
F:\solr-4.10.2\dist目录下的:
apache-solr-dataimporthandler-3.6.0.jar ,
solr-dataimporthandler-extras-4.5.0.jar
共计三个jar包拷贝到F:\tomcat-7.0.47\webapps\solr\WEB-INF\lib 目录下。
2)、在F:\solrHome\solrAricle\conf目录下建立名为data-config.xml的空文件,复制下面的配置文件。
-------------column字段一定要大写 -----------------
<dataConfig>
<dataSource type="JdbcDataSource" driver="oracle.jdbc.driver.OracleDriver" url="jdbc:oracle:thin:@127.0.0.1:1521:ORCL" user="ITSVPLATFORM" password="ITSVPLATFORM"/>
<document>
<entity name="article" query="select id, title, content from article ">
<field column="ID" name="id" />
<field column="TITLE" name="title" />
<field column="CONTENT" name="content" clob="true" stripHTML="true" />
</entity>
</document>
</dataConfig>
3)、在F:\solrHome\solrAricle\conf目录下的solrconfig.xml任意位置加上下面的配置文件.
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
<str name="config">data-config.xml</str>
</lst>
</requestHandler>
14、配置完成。
访问地址:
http://localhost:8080/solr
本文出自 “信仰之名” 博客,请务必保留此出处http://longzhang.blog.51cto.com/9597888/1590572
标签:全文检索
原文地址:http://longzhang.blog.51cto.com/9597888/1590572