?? 全文检索(Full-Text Retrieval)是指以文本作为检索对象,找出含有指定词汇的文本。全面、准确和高速是衡量全文检索系统的关键指标。 l关于全文检索,我们要知道: 1。仅仅处理文本。 2,不处理语义。 3,搜索时英文不区分大写和小写。 4。结果列表有相关度排序。 l在信息检索工具中 ...
分类:
Web程序 时间:
2017-04-18 12:26:59
阅读次数:
192
这里书中写的是charactorProcess(File file, String destFile) 这里被我改成。(String file, String destFIle) 一个代表现有的文件和要新建的文件 代码: package com; import java.io.BufferedRea ...
分类:
Web程序 时间:
2017-04-17 16:15:09
阅读次数:
206
今天来写写搜索,如今做的这个项目中涉及到了非常多的搜索大部分是我做的,有次经理问我有没实用过luence这个搜索引擎。这个还真没实用过仅仅是听说过有这么个搜索工具包,一直没有接触过。利用做项目空暇的时间也在逐渐了解搜索方面的东西。对搜索也又一次认识了一下认为搜索方向还是非常值得我们研究和应用的。 在 ...
分类:
Web程序 时间:
2017-04-17 15:53:05
阅读次数:
201
概述 Elasticsearch (ES)是一个基于 Lucene 的开源搜索引擎,它不但稳定、可靠、快速,而且也具有良好的水平扩展能力,是专门为分布式环境设计的。 特性 安装方便:没有其他依赖,下载后安装非常方便;只用修改几个参数就可以搭建起来一个集群 JSON:输入/输出格式为 JSON,意味着 ...
分类:
其他好文 时间:
2017-04-17 12:44:36
阅读次数:
218
前端js框架:jquery 前端ui框架:layui 后端ui框架:easyui 后端视图:jsp 全栈框架:spring(主要使用依赖注入和面向切面) web框架:spring mvc 持久层框架:mybatis 安全框架:shiro 日志框架:log4j 缓存框架:待定 全文检索引擎:lucen ...
分类:
其他好文 时间:
2017-04-17 09:57:17
阅读次数:
129
ElasticSearch 是一个基于 Lucene 的高度可扩展的开源全文搜索和分析引擎。它能够做到可以快速、实时地存储、搜索和分析大量数据。它通常作为底层引擎/技术,为具有复杂搜索功能和要求的应用程序提供支持。 笔者在大学期间试着搭建过 ES 集群,当时也仅限于尝试着搭建玩玩。现在开始,想要去系 ...
分类:
其他好文 时间:
2017-04-14 01:27:52
阅读次数:
271
elasticsearch是基于Lucene的全文检索服务器 es配置没有solr那么复杂,它会在局域网中检测相同集群的节点,只需要在同一网段和相同集群名。 而且es本身自带zk的分布式管理功能,个人感觉比solr配置简单很多。 选用的es版本2.4.4(对应Lucene版本5.5.2) http: ...
分类:
其他好文 时间:
2017-04-11 16:31:36
阅读次数:
199
kill -9或者断电等原因异常,es在重启后,会通过translog来进行数据恢复。 默认的恢复速度是较慢的,可以设置indices.recovery.current_streams:10增大恢复的线程数,还可以设置indices.recovery的其他参数加快恢复的速度。 但是某些情况下,如lu ...
分类:
其他好文 时间:
2017-04-10 23:35:37
阅读次数:
550
原文链接:https://my.oschina.net/rickylau/blog/527602 保存此段包含的文档,每篇文档中包含的域以及每个域的信息。 .tim文件中存储着每个域中Term的统计信息且保存着指向.doc, .pos, and .pay 索引文件的指针。 .tip文件保存着Term ...
分类:
Web程序 时间:
2017-04-10 22:39:21
阅读次数:
225
上中学的时候写作文,最喜欢的季节我都是写冬天。虽然是因为写冬天的人比较少,那时确实也是对其他季节没有什么特殊的偏好,反而一到冬天,自己皮肤会变得特别白。但是冬天啊,看到的只有四季常青盆栽:瓜栗(就是发财树,好吧,算我矫情,反正我不喜欢这个名字),绿萝,永远看不到它开花的巴西铁,富贵竹,散尾葵……过年 ...
分类:
编程语言 时间:
2017-04-09 09:33:46
阅读次数:
361