标签:
上一篇博文有介绍使用Solr的命令solrindex建立索引并提交到Solr服务器,那么我们怎么样查看solrindex命令产生的索引内容呢?这就要使用本篇博文要分享的工具LUKE,通过LUKE工具,我们可以很清楚的看到通过solrindex命令产生的索引内容。
点击lukeall-4.0.0-ALPHA.jar,进入下载页面进行下载。
下载之后在windows系统上面使用命令行启动LUKE:
java -jar lukeall-4.0.0-ALPHA.jar
运行过程:
启动界面:
通过点击Browse按钮,会弹出文件夹选择框:
选择打开按钮,选择索引路径:
选择Solr的所有路径之后,在Path to Index directory对话框中,其他选择都默认,选择OK按钮,即可进入LUKE的主界面,在Overview栏位显示Solr索引的大致内容:
总共有11个索引字段:
各个字段名称为:
总共有811个网页:
总共有80468个分词item:
选择每个字段,然后选择Show top items按钮,即可在右侧看到详细的Items信息,里面包含了默认的分词信息:
各个字段的含义如下:
anchor
boost
不做索引,没有内容:
cache
也不做索引:
content
页面的内容:
digest
也不做索引:
host
从url里面提取的主机信息:
id
也是从url中提取出来的:
segment
指页面存在哪个segment里面:
title
页面的title:
tstamp
不做索引:
url
分词可以进行搜索的:
从Overview的title字段里面选择一个分词进行search,选择:图
在Search栏位,输入:“title:图”,然后选择Search按钮,得到结果:
标签:
原文地址:http://blog.csdn.net/kandy_ye/article/details/51338113