码迷,mamicode.com
首页 >  
搜索关键字:lucene restful    ( 5579个结果
[转载]非常的好的协同过滤入门文章
“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一...
分类:其他好文   时间:2014-06-27 14:21:53    阅读次数:225
.net主要题型积累
1、简述private、protected、public、internal修饰符的访问权限。private:私有成员,在类的内部才可以访问。protected:保护成员,该类内部和继承类中可以访问。public:公共成员,完全公开,没有访问限制。internal:当前程序集内可以访问。2、ADO.N...
分类:Web程序   时间:2014-06-27 13:22:54    阅读次数:341
Hadoop技术内幕HDFS-笔记1
书籍学习——董西成《Hadoop技术内幕 深入解析HADOOP COMMON和HDFS架构设计与实现原理》HDFS 高容错,高伸缩性Lucene是引擎开发包,提供了一个纯java的高性能全文检索,可方便的嵌入到各种应用中实现全文搜索/索引功能。Nutch是以Lucene为基础实现的搜索引擎应用,Lu...
分类:其他好文   时间:2014-06-27 12:15:57    阅读次数:221
HTTP幂等性简单了解
基于HTTP协议的WebAPI是时下最为流行的一种分布式服务提供方式。无论是在大型互联网应用还是企业级架构中,我们都见到了越来越多的SOA或RESTful的WebAPI。为什么WebAPI如此流行呢?我认为很大程度上应归功于简单有效的HTTP协议。HTTP协议是一种分布式的面向资源的网络应用层协..
分类:其他好文   时间:2014-06-27 06:40:59    阅读次数:220
几款开源的中文分词系统
中文分词是做好中文内容检索、文本分析的基础,主要应用于搜索引擎与数据挖掘领域。中文是以词为基本语素单位,而词与词之间并不像英语一样有空格来分隔,因而中文分词的难点在于如何准确而又快速地进行分词以下介绍4款开源中文分词系统。1、ICTCLAS – 全球最受欢迎的汉语分词系统 中文词法分析是中文信息处理...
分类:其他好文   时间:2014-06-26 22:35:29    阅读次数:298
几种开源分词工具的比較
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:其他好文   时间:2014-06-26 16:38:46    阅读次数:160
大规模并发 .(转)
何谓大规模并发,不同层面有不同的理解企业应用(Intranet):千级强并发,万级弱并发(在线用户),十万级用户 大型企业ERP、供应链,大型企业HR、办公OA互联网应用(Internet):百万级强并发,千万级弱并发(在线用户),亿级用户/门户网站(新浪、腾讯)平台级电子商务(阿里巴巴、淘宝网、....
分类:其他好文   时间:2014-06-26 14:36:59    阅读次数:179
如何用Google APIs和Google的应用系统进行集成(8)----如何把Google Blogger(博客)的JSON Schema转换成XML的Schema(XSD)?
在Google RESTFul API中,Google Blogger API应该和我们的生活离得最近;因为几乎很多人每天都在看博客,都在写博客,都听说过博客。在前面的Google的应用系统进行集成(5)和Google的应用系统进行集成(6)的系列文章中,我们提到了如何把Google Calendar和Google Tasks的JSON Schema转换成XML的XSD的Schema;从博客的访问量来看,还是有很多志同道合的朋友们对这个比较感兴趣,因此,这个章节,我继续给大家奉献和分享一下如何把Google...
分类:Windows程序   时间:2014-06-26 14:34:31    阅读次数:320
Lucene中TokenStream,Tokenizer,TokenFilter,TokenStreamComponents与Analyzer
TokenStream extends AttributeSource implements Closeable: incrementToken,end,reset,close Tokenizer直接继承至TokenStream,其输入input是一个reader TokenFilter也直接继承TokenStream,但input是一个TokenStream。 TokenStreamCo...
分类:其他好文   时间:2014-06-26 13:19:13    阅读次数:177
ElasticSearch
ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。 我们建立一个网站或应用程序,并要添加搜索功能,令我们受打击的是:搜索工作是很难的。我们希望...
分类:其他好文   时间:2014-06-26 12:33:39    阅读次数:197
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!