搞Solr这一年 去年6月份毕业到现在已经快一年半了,很庆幸从事了搜索引擎这份工作,虽然谈不上有多深入,但至少已经入门了。在这一年半里,搞了3个月的hbase和mapreduce,搞了一个月的nutch,最后搞了一年的Solr。想当初刚参加项目的时候,大家对hbase、solr一点都不懂,通过慢慢....
分类:
其他好文 时间:
2014-12-09 22:58:44
阅读次数:
230
李克华云计算高级群: 292870151 交流:Hadoop、NoSQL、分布式、lucene、solr、nutch 在Solr中配置中文分词IKAnalyzer1、在配置文件schema.xml(位置{SOLR_HOME}/config/下),配置信息如下: ...
分类:
其他好文 时间:
2014-12-05 17:02:09
阅读次数:
148
java 网络爬虫框架:
apache Nutch ,Heritrix 等,主要参照开源社区提供的40个开源项目...
分类:
编程语言 时间:
2014-12-02 16:41:33
阅读次数:
190
Nutch教程中文翻译1(官方教程,中英对照)——Nutch的编译、安装和简单运行...
分类:
其他好文 时间:
2014-12-01 14:20:20
阅读次数:
265
教程:https://app.yinxiang.com/shard/s12/sh/36b8e911-2d0e-4ee4-b34f-a426c6dc99c2/9543f94cd8abf12b4b9857e67709ad42nutch:http://nutch.apache.org/downloads....
2. plugin.auto-activation:当被配置为过滤(即不加载),但是又被其他插件依赖的时候,是否自动启动,缺省为 true。
plugin.auto-activation
true
3. plugin.includes:要包含的插件名称列表,支持正则表达式方式定义。
...
分类:
其他好文 时间:
2014-11-30 07:07:52
阅读次数:
211
以前搭建环境或是配置软件从来都没有留Tips的习惯,但实践证明这是错误的——做过不等于记得怎么做,遇到过的错误也不等于今后就不是错误了。Nutch跟Hadoop的搭建困扰了我很久,但回头看看又觉得真正有些问题的其...
分类:
其他好文 时间:
2014-11-26 21:04:50
阅读次数:
188