标签:use syn div mysql stand -- tokenizer config col
1. Schema.xml
在schema.xml文件中,主要配置了solrcore的一些数据信息,包括Field和FieldType的定义等信息,在solr中,Field和FieldType都需要先定义后使用。
其中的id是在Field标签中已经定义好的域名,而且该域要设置为required为true。
一个schema.xml文件中必须有且仅有一个唯一键
由dest指的的目标域,必须设置multiValued为true。
<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100"> <analyzer type="index"> <tokenizer class="solr.StandardTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" /> <!-- in this example, we will only use synonyms at query time <filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/> --> <filter class="solr.LowerCaseFilterFactory"/> </analyzer> <analyzer type="query"> <tokenizer class="solr.StandardTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" /> <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> <filter class="solr.LowerCaseFilterFactory"/> </analyzer> </fieldType>
2. 中文分词器(ikanalyzer)
第一步:将ikanalyzer的jar包拷贝到以下目录
第二步:将ikanalyzer的扩展词库的配置文件拷贝到 目录
第三步:配置FieldType
第四步:配置使用中文分词的Field
第五步:重启tomcat
3. Dataimport(该插件可以将数据库中指定的sql语句的结果导入到solr索引库中)
复制以下目录的jar包
添加到以下目录(lib目录需要新建)
修改solrconfig.xml文件,添加lib标签
<lib dir="${solr.install.dir:../..}/contrib/dataimporthandler/lib" regex=".*\.jar" />
将mysql的驱动包,复制到以下目录
修改solrconfig.xml文件,添加lib标签
<lib dir="${solr.install.dir:../..}/contrib/db/lib" regex=".*\.jar" />
在solrconfig.xml中,添加一个dataimport的requestHandler
在solrconfig.xml同级目录下,创建data-config.xml
标签:use syn div mysql stand -- tokenizer config col
原文地址:http://www.cnblogs.com/zjfjava/p/7672660.html