码迷,mamicode.com
首页 >  
搜索关键字:lucene 全文检索    ( 2861个结果
插入员工信息文档(indexing employee documents)
首先就是存储员工信息数据。这里将会使用一个文档描述一个员工的“employee document”形式。实际上在ES中存储数据的动作叫index,但是在我们index一个文档的时候首先要确定去哪里储存数据。在ES中,一个文档是相当于一个type,若干type从属于一个index。可以从下面和关系性数...
分类:其他好文   时间:2014-05-09 10:40:21    阅读次数:239
毕业课题思考记录
用这篇日志记录在做毕业课题的一些思考,按时间分割。2014/02至2014/04: 抽了一些时间,看林轩田老师的《机器学习基石》,大致对机器学习、数据挖掘有了一个认识,数据挖掘更侧重于挖掘大量或潜在的数据,从而对一些问题进行分析,机器学习则是通过大量已知数据的训练,形成机器的思维,从而“学会”对.....
分类:其他好文   时间:2014-05-09 10:14:27    阅读次数:289
LogStash日志分析系统
简介通常日志管理是逐渐崩溃的——当日志对于人们最重要的时候,也就是出现问题的时候,这个渐进的过程就开始了。日志管理一般会经历一下3个阶段:初级管理员将通过一些传统工具(如cat、tail、sed、awk、perl以及grep)对日志进行检查,但它的适用范围仅限于少量的主机和日志文件类型;考虑到现实中...
分类:其他好文   时间:2014-05-09 08:18:10    阅读次数:651
(转)HubbleDotNet+Mongodb 构建高性能搜索引擎--概述
HubbleDotNet 从 1.2.3 版本以后开始在官方代码中支持和 Mongodb 对接,Mongodb 是10gen 公司开发的 no-sql 数据库,其读写性能比传统关系数据库要快很多,而且可以非常方便的分布式部署。HubbleDotNet 通过支持 Mongodb 也使其本身同时具备了 ...
分类:数据库   时间:2014-05-09 08:05:58    阅读次数:476
(转)HubbleDotNet 和 Lucene.net 性能对比测试
HubbleDotNet 从 2009 年11月份发布第一个版本以来, 只对 0.7 版本做过一次性能对比测试,原因是近一年来,HubbleDotNet一直在做性能优化,截至2010年9月,性能已经优化的差不多了,索引和查询的性能比 0.7 版本时提高了很多倍。这两天重新对HubbleDotNet ...
分类:Web程序   时间:2014-05-09 07:59:17    阅读次数:544
全文检索(full-text search)
目前认识到的ES就是进行了简单的name匹配,age过滤。来试试更高级的-全文检索-一个传统数据库依然挣扎的任务。现在要搜索对”rock climbing“感兴趣的员工信息,如下:GET /megacorp/employee/_search{ "query":{ "match":{ ...
分类:其他好文   时间:2014-05-09 02:51:06    阅读次数:251
Lucene suggest [转]
TheBig Data Zoneis presented bySplunk, the maker of data analysis solutions such asHunk, an analytics tool for Hadoop, and theSplunk Web Framework.Liv...
分类:其他好文   时间:2014-05-08 19:31:55    阅读次数:596
电商论道---(3).net开发solr
这一节我们看下怎样把查询数据放到服务器端存储,这里我们需要使用客户端工具来操作与服务端数据打交道,网上有好多基于.NET开发的SOLR客户端,我们这里选择easynet.solr,很方便的一个DLL,       下载地址:http://easynet.codeplex.com/SourceControl/latest       这一节主要包括Solr数据索引的添加,修改,删除,查询等简单功...
分类:Web程序   时间:2014-05-07 05:12:00    阅读次数:691
PHP+MYSQL实现全文检索及全文检索工具
使用分词类库,分词类库请参见:http://www.xunsearch.com/scws/ 如何使用PHP实现全文检索功能? 很多人可能马上可以想出几种方案,比如:文件检索法、采用SQL的like语句等方法,但这些方法效率都相当的低。 这里介绍一种比较高效的PHP全文检索实现方法,这就是采用MYSQL的FULLTEXT字段类型。但是MYSQL的FULLTEXT字段对中文的支持不是很好,本...
分类:数据库   时间:2014-05-07 05:00:43    阅读次数:513
用lucene.net根据关键字检索本地word文档
目前在做一个winform小软件,其中有一个功能是能根据关键字检索本地保存的word文档。第一次是用com读取word方式(见上一篇文章),先遍历文件夹下的word文档,读取每个文档时循环关键字查找,结果可想而知效率很慢。检索结果是一条接一条显示出来的o(>_ 2 /// 创建索引...
分类:Web程序   时间:2014-05-07 02:20:56    阅读次数:428
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!