原文来自于:http://www.csdn.net/article/2014-09-01/2821485-how-to-perform-fuzzy-matching-with-mongo-connector摘要:短短两年,Mongo Connector取得了突破性的进展,用户已经可以通过它完成连接器...
分类:
其他好文 时间:
2014-09-03 16:20:06
阅读次数:
210
httptest4net是可以自定义HTTP压力测试的工具,用户可以根据自己的情况编写测试用例加载到httptest4net中并运行测试。由于最近需要对elasticsearch搜索集群进行一个不同情况的测试,所以针对这个测试...
分类:
Web程序 时间:
2014-09-03 15:10:37
阅读次数:
305
网络爬虫架构在Nutch+Hadoop之上,是一个典型的分布式离线批量处理架构,有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项。由于网络爬虫只负责网络资源的抓取,所以,需要一个分布式搜索引擎,用来对网络...
分类:
其他好文 时间:
2014-08-30 23:13:50
阅读次数:
434
准备工作安装:openssl卸载旧版本apt-get remove opensslapt-get autoremove openssl下载最新版本wget http://www.openssl.org/source/openssl-1.0.1i.tar.gztar -zxvfopenssl-1.0....
分类:
其他好文 时间:
2014-08-30 18:57:19
阅读次数:
3363
配置文件位于%ES_HOME%/config/elasticsearch.yml文件中,用Editplus打开它,你便可以进行配置。 所有的配置都可以使用环境变量,例如:node.rack: ${RACK_ENV_VAR} 表示环境变量中有一个RACK_ENV_VAR变量。 下面列举一下elasti...
分类:
其他好文 时间:
2014-08-27 12:33:47
阅读次数:
186
1、参考文档:http://www.elasticsearch.org/guide/en/elasticsearch/hadoop/current/configuration.htmlhttp://www.elasticsearch.org/guide/en/elasticsearch/hadoop...
分类:
其他好文 时间:
2014-08-23 09:58:30
阅读次数:
213
es在查询时,可以指定搜索类型为QUERY_THEN_FETCH,QUERY_AND_FEATCH,DFS_QUERY_THEN_FEATCH和DFS_QUERY_AND_FEATCH。那么这4种搜索类型有什么区别?
分布式搜索背景介绍:
ES天生就是为分布式而生,但分布式有分布式的缺点。比如要搜索某个单词,但是数据却分别在5个分片(Shard)上面,这5个分片可能在5台主机...
分类:
其他好文 时间:
2014-08-22 21:13:59
阅读次数:
369
一、统计信息相关命令的变化
有关集群状态cluster_state, 节点信息nodes_info, 节点统计信息nodes_stats和索引信息indices_stats命令格式进行了统一,比如查看集群信息使用命令:
curl -XGET http://localhost:9200/_cluster/state/nodes?pretty=1
查看节点统计信息:
curl ...
TestQuery:http://app.yinxiang.com/shard/s34/sh/665797f5-de0b-4db2-b51c-8f404baf25d2/94aa4bee41e4a404f9921e85b6f011bd TestFilter:http://app.yinxiang.com/shard/s34/sh/25bf71b1-45d7-4f6e-8740-bcd226...