搜索引擎选型调研文档 Elasticsearch简介* Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。 它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。 Elasticsearch是一个建立在全文搜索引擎 Apache ...
分类:
其他好文 时间:
2017-06-13 23:46:30
阅读次数:
331
最近需要计算制造业领域大词表每个词的idf,词表里一共九十多万个词,语料一共三百七十多万篇分词后文献。最开始尝试用程序词表循环套语料循环得到每个词的idf,后来又尝试把语料存入mysql然后建立全文索引再循环用sql语句去查每个词的idf,效率都十分不理想。 最新的想法是利用solr搜索引擎的速度来 ...
分类:
数据库 时间:
2017-06-05 18:58:04
阅读次数:
182
电商搜索中要实现这么一块功能,当输入文字时候。下拉框提示。类似于百度搜索 在师出名门的基于lucene的solr搜索引擎中。提供了 拼写检查和智能提示这块功能。 拼写检查就是用来检查用户输入的检索内容是否存在,假设不存在则,给它提示出相近,或相似的内容。 而检索建议则是用户输入某个检索条件后。会立马 ...
分类:
其他好文 时间:
2017-05-04 11:07:23
阅读次数:
143
跟着<<Django by Example>> 一路做下来,到了搭建搜索引擎的步骤 默认的思路是用 obj.objects.filter(body__icontains='framework') 然后把得到的QuerySet 返回到模板中使用 首先要确保你的java版本在 1.7或之上 使用 jav ...
分类:
其他好文 时间:
2017-04-18 12:30:39
阅读次数:
339
搜索引擎选型调研文档 Elasticsearch简介* Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。 它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。 Elasticsearch是一个建立在全文搜索引擎 Apache ...
分类:
其他好文 时间:
2017-02-27 10:39:38
阅读次数:
196
Solr搜索技术 今日大纲 回顾上一天的内容: 倒排索引 lucene和solr的关系 lucene api的使用 CRUD 文档、字段、目录对象(类)、索引写入器类、索引写入器配置类、IK分词器 查询解析器、查询对象(用户要查询的内容)、索引搜索器(索引库的物理位置)、排名文档集合(包含得分文档数... ...
分类:
其他好文 时间:
2017-01-10 23:29:51
阅读次数:
423
前期准备 搭建solr服务 参考上一篇,搭建solr搜索服务。 添加依赖 maven工程的话,添加如下依赖, 也可以自己导入jar包 在solr安装目录下,找到solr-5.5.3\dist\solrj-lib路径,添加里面所有的jar包到自己的工程,别忘了在外面的文件夹还有个solr-solrj- ...
分类:
编程语言 时间:
2016-11-11 19:38:23
阅读次数:
242
Solr与ES(ElasticSearch)对比 Solr与ES(ElasticSearch)对比 搜索引擎选择: Elasticsearch与Solr 搜索引擎选型调研文档 Elasticsearch简介* Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去 ...
分类:
其他好文 时间:
2016-11-05 20:09:56
阅读次数:
346
Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。 快速上手数据挖掘之solr搜索引擎高级教程(Solr ...
分类:
其他好文 时间:
2016-08-19 23:53:30
阅读次数:
215
下载安装 下载地址 https://mirrors.tuna.tsinghua.edu.cn/apache/lucene/solr/ 选择最新的版本,有两种压缩包,zip和tgz,根据使用的操作系统来选择,如果是Linux系统,就下载tgz压缩包 如果是windows系统,下载zip压缩包,但在wi ...
分类:
其他好文 时间:
2016-07-23 11:53:03
阅读次数:
292