前段时间学习solr,兴致勃勃的从官网下载到solr5.3.0最新版本,然后在后期部署时出现了很多问题。首先,4.0到5.0是个大版本更新,下载 的压缩包的文件结构有了很多变化,导致网上很多关于solr低版本的教程没有了指导意义(当然,无障碍阅读原版文档的大神无视之)。这个还好说,最扯淡的 是5.0 ...
分类:
其他好文 时间:
2016-07-06 10:00:53
阅读次数:
109
前言 老规矩,任何技术的入门我通常都会总结增删改查,本文我就通过HttpWebRequest和SolrNet的方式实现Solr最基础的增删改查(CURD)。对于自己的完整项目,同时不想过于依赖第三方类库的则通过Http接口的方式来调用Solr。 当然也有人喜欢调用第三方的类库,简单方便,不需要自己处 ...
分类:
Web程序 时间:
2016-06-23 20:32:32
阅读次数:
467
前言 用过Lucene.net的都知道,我们自己搭建索引服务器时和解决搜索匹配度的问题都用到过盘古分词。其中包含一个词典。 那么既然用到了这种国际化的框架,那么就避免不了中文分词。尤其是国内特殊行业比较多。比如油田系统从勘探、打井、投产等若干环节都涉及一些专业词汇。 再像电商,手机、手机配件、笔记本 ...
分类:
其他好文 时间:
2016-06-21 19:09:50
阅读次数:
224
Solr中默认的中文分词是用Lucene的一元分词包。 现在说明在Solr5.0中配置Lucene的SmartCN中文分词包。 1,进入Solr的安装目录,我这里是:/root/nutch/solr-5.0.0 把contrib/analysis-extras/lucene-libs/lucene- ...
分类:
其他好文 时间:
2016-06-17 21:02:40
阅读次数:
168
前言 前前后后接触Solr有一个多月了,想趁着学习Solr顺便把java拾起来。我分别用4.X和5.X版本在windows环境下用jetty的方式、tomcat部署的方式自己搭建了一把。其中从4.x到5.x和6.x的变化还是有的。搭建起来Solr后我分别用调用http接口的方式、SolrNet实现了 ...
CentOS下安装Solr5.3 http://www.centoscn.com/image-text/install/2015/0918/6190.html solr5.3.1 集群服务搭建 solr-集群安装搭建-入门 http://www.open-open.com/lib/view/open ...
分类:
其他好文 时间:
2016-05-28 17:24:26
阅读次数:
335
一. 说明 Solr5内置了Jetty服务,所以不用安装部署到Tomcat了,网上部署Tomcat的资料太泛滥了。 部署前的准备工作: 1. 将各主机IP配置为静态IP(保证各主机可以正常通信,为避免过多的网络传输,建议在同一网段)。 2. 修改主机名,配置各主机映射;修改hosts文件,加入各主机 ...
分类:
其他好文 时间:
2016-05-28 15:56:19
阅读次数:
318
1.通过python编写爬虫,数据存储到hdfs当中 2.通过solr在hdfs当中建立索引并实现全文检索功能 好了,正文开始了! 一,环境搭建 1.python3.4.4安装及环境变量配置 2.hadoop2.6.3安装及环境变量配置(单机) 3.solr5.5安装及配置 1. 下载tomcat9 ...
分类:
编程语言 时间:
2016-05-20 09:53:34
阅读次数:
294
说一下大体思路,电商类网站,由于老项目数据库设计很不合理,一些查询涉及的表过多,导致查询速度异常缓慢,在不修改架构设计和源码上,做了一下处理。 solr+eh ,使用eh缓存关联数据,再用solr查询速度,文章偏向小白文,大神见笑。很多设计不完善,实现功能为主。 一、配置缓存功能 结合我之前博文的e ...
分类:
其他好文 时间:
2016-05-19 21:27:56
阅读次数:
396
下载 ik分词包 地址:http://http://pan.baidu.com/s/1c1RcnAw 1.修改 pom.xml 修改成你使用的版本,保存 解压后在工程目录内 打开命令窗口 输入 mvn -DskipTests clean package 完成后 2.部署项目 把生成的jar 放到 s ...
分类:
其他好文 时间:
2016-05-17 19:16:39
阅读次数:
318