搜索关键字：lucene nrt，搜索到2456个结果！码迷,mamicode.com！

[转载]非常的好的协同过滤入门文章

“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制，实现方法，其中还涉及一些基本的优化方法，例如聚类和分类的应用。同时在理论讲解的基础上，还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略，进行策略优化，构建高效的推荐引擎的方法。本文作为这个系列的第一...

分类：其他好文时间：2014-06-27 14:21:53 阅读次数：225

.net主要题型积累

1、简述private、protected、public、internal修饰符的访问权限。private:私有成员,在类的内部才可以访问。protected:保护成员，该类内部和继承类中可以访问。public:公共成员，完全公开，没有访问限制。internal:当前程序集内可以访问。2、ADO.N...

分类：Web程序时间：2014-06-27 13:22:54 阅读次数：341

15个nosql数据库

1、MongoDB介绍MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。主要解决的是海量数据的访问效率问题，为WEB应用提供可扩展的高性能数据存储解决方案。当数据量达到50GB以上的时候，MongoDB的数据库访问速度是MySQL的10倍以上。MongoDB的并发读写效率不是特别出色...

分类：数据库时间：2014-06-26 23:15:17 阅读次数：292

几款开源的中文分词系统

中文分词是做好中文内容检索、文本分析的基础，主要应用于搜索引擎与数据挖掘领域。中文是以词为基本语素单位，而词与词之间并不像英语一样有空格来分隔，因而中文分词的难点在于如何准确而又快速地进行分词以下介绍4款开源中文分词系统。1、ICTCLAS – 全球最受欢迎的汉语分词系统中文词法分析是中文信息处理...

分类：其他好文时间：2014-06-26 22:35:29 阅读次数：298

几种开源分词工具的比較

搜集了一些资料，与同学一起进行了简单的測试，总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文（unicode）中文：单字符切分英文：依据空格切分ChineseAnalyzer中文，不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...

分类：其他好文时间：2014-06-26 16:38:46 阅读次数：160

大规模并发 .(转)

何谓大规模并发，不同层面有不同的理解企业应用（Intranet）：千级强并发，万级弱并发（在线用户），十万级用户大型企业ERP、供应链,大型企业HR、办公OA互联网应用（Internet）：百万级强并发，千万级弱并发（在线用户），亿级用户/门户网站（新浪、腾讯）平台级电子商务（阿里巴巴、淘宝网、....

分类：其他好文时间：2014-06-26 14:36:59 阅读次数：179

Lucene中TokenStream,Tokenizer,TokenFilter,TokenStreamComponents与Analyzer

TokenStream extends AttributeSource implements Closeable: incrementToken,end,reset,close Tokenizer直接继承至TokenStream,其输入input是一个reader TokenFilter也直接继承TokenStream,但input是一个TokenStream。 TokenStreamCo...

分类：其他好文时间：2014-06-26 13:19:13 阅读次数：177

ElasticSearch

ElasticSearch是一个基于Lucene构建的开源，分布式，RESTful搜索引擎。设计用于云计算中，能够达到实时搜索，稳定，可靠，快速，安装使用方便。支持通过HTTP使用JSON进行数据索引。我们建立一个网站或应用程序，并要添加搜索功能，令我们受打击的是：搜索工作是很难的。我们希望...

分类：其他好文时间：2014-06-26 12:33:39 阅读次数：197

【Lucene4.8教程之四】分析

1、基础内容（1）相关概念分析(Analysis)，在Lucene中指的是将域(Field)文本转换成最基本的索引表示单元--项(Term)的过程。在搜索过程中，这些项用于决定什么样的文档能够匹配查词条件。分析器对分析操作进行了封装，它通过执行若干操作，将文本转化成语汇单元，这个处理过程也称为语汇单元化过程(tokenization)，而从文本洲中提取的文本块称为语汇单元(token)...

分类：其他好文时间：2014-06-24 22:55:00 阅读次数：241

【Lucene4.8教程之六】QueryParser与Query子类：如何生成Query对象

对于一个搜索而言，其核心语句为： searcher.search(query, 10);此时，其最重要的参数为一个Qeury对象。构造一个Query对象有2种方法：【均以在contents域搜索java关键词为例】（1）使用Query的子类，如BooleanQuery, ConstantScoreQuery, DisjunctionMaxQuery, FilteredQuery, M...

分类：其他好文时间：2014-06-24 17:38:36 阅读次数：281

共2456条上一页 1 ... 231 232 233 234 235 ... 246 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)