题意简述:做一个极其简单的搜索系统,对以下四种输入进行分析与搜索: 1. 只有一个单词:如 term, 只需找到含有这个单词的document,然后把这个document的含有这个单词term的那些行输出。 2.term1 AND term2, 找到同时含有term1 和 term2 的...
分类:
Web程序 时间:
2015-05-11 21:38:05
阅读次数:
301
springmvc+mybatis+lucene4文档搜索系统(支持分页) 源代码下载地址:http://www.zuidaima.com/share/1550463731436544.htm...
分类:
编程语言 时间:
2015-04-29 11:48:37
阅读次数:
244
对搜索引擎的定义: ????????一个搜索引擎由搜索器 、索引器 、检索器和用户接口 四个部分组成。 1:搜索器:不断的发现新的校园宣讲会链接, 并将网页下载下来 2:索引器:从网页正文中提取宣讲会主题,...
分类:
其他好文 时间:
2015-04-22 18:53:23
阅读次数:
177
之前一共说了几个软件库,串口通讯的,xml加载的,还有动态提示的,通过这三个库就可以实现一个自己的串口调试工具,成品如下 动态加载配置文件之后如下软件可以在xml中配置发送的字符串,不算是大工程,但是灵活使用了之前的几个类库,上几个核心代码首先是遍历系统串口,如下//搜索系统当前串口,并实时显示.....
分类:
编程语言 时间:
2015-04-19 21:02:39
阅读次数:
151
#include 编译时至搜索系统默认包含路径,一般是库函数的头文件。#include" " 编译时先搜索源代码当前目录,再搜索系统默认包含路径,一般是程序员自己的头文件。
分类:
其他好文 时间:
2015-04-18 20:27:54
阅读次数:
104
coreseek 实战总结该文章包含以下内容:
coreseek 的典型架构
实时性解决方案
mmseg 分词使用经验
同义词使用经验
后继目标
coreseek 的典型架构coreseek 的典型结构,就是通过增量索引来满足近似实时性,对于新增的记录无法及时搜索可见。对于搜索系统存在的记录,非字符串字段的更新,我们一般是调用update方法进行更新。如果搜索引擎要返回业务的其他字段,这时字段的实时...
分类:
其他好文 时间:
2015-04-04 18:27:56
阅读次数:
150
1. PageRank算法概述 PageRank,即网页排名,又称网页级别、Google左側排名或佩奇排名。 是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获得空前的成功后,该算法也成为其他搜索引擎和学术界十分关注的计算模...
分类:
编程语言 时间:
2015-03-30 13:04:16
阅读次数:
206
1.文件搜索命令 locate 命令格式 : locate 文件名 (只能文件名)#按/etc/updatedb.conf配置文件在后台数据库中(/var/lib/mlocate)按文件名搜索ps: 1.不是实时更新,updatedb 更新数据库2.搜索系统命令 whereis、which(1).命...
分类:
其他好文 时间:
2015-03-16 00:49:14
阅读次数:
157
压缩命令继续将文件夹中的文件全部压缩 : tar -czvf xx.tar.gz * (*指的是全部的东西可医用各个文件名代替)解压的话先使用gunzip 命令解压 再使用tar命令拆开 tar -xwhereis 搜索 仅仅可以搜索系统命令,man文档以及源代码 而且只搜索位置命令后面加上& 表示...
分类:
系统相关 时间:
2015-01-16 16:01:21
阅读次数:
151
昨天的搜索系统又出状况了,几个库同时重建索引变得死慢。经过一个上午的复现分析,确定问题出现httpclient的使用上(我使用的是3.1这个被广泛使用的遗留版本)。搜索系统在重建索引时,是并发多个线程(默认是8个)不停的从PHP客户端取数据(当然,从另一个角度来说,搜索系统是客户端,PHP端是服务端...
分类:
Web程序 时间:
2015-01-04 15:18:47
阅读次数:
181