码迷,mamicode.com
首页 > 其他好文 > 详细

Hello Lucid Fusion

时间:2015-01-16 13:09:53      阅读:264      评论:0      收藏:0      [点我收藏+]

标签:search

Meet Lucid Fusion

https://docs.lucidworks.com/display/fusion/Getting+Started 

http://zh.hortonworks.com/partner/lucidworks/ 

https://lucidworks.com/blog/noob-notes-fusion-first-look/ 

 

hadoop@hadoop:~/soft/lucid-fusion/bin$ ./fusion start

2015-01-07 07:16:46Z Starting Fusion Solr on port 8983

2015-01-07 07:17:16Z Starting Fusion API Services on port 8765

2015-01-07 07:17:21Z Starting Fusion UI on port 8764

2015-01-07 07:17:26Z Starting Fusion Connectors on port 8984

访问http://localhost:8764, 用户名/密码: admin/password123

技术分享

点击Admin, 创建一个Collection

技术分享

点击Actions>DataSource, 选择下拉框Web选项. The form will prompt you to enter a name for this datasource, perhaps "Lucidworks" or similar.  The index pipeline id has already been supplied, and you can leave that default for now.  Under Properties, then Start Links, click the add item button and enter ‘http://lucidworks.com‘.  Click Add datasource to save your changes.

技术分享

点击Start,等待状态变为Finished

技术分享

点击左侧的Search, 验证索引的数量=1188, 和上面的documents数量一致

技术分享

Collections首页可以看到所有索引集合的概览包括文档数量索引大小热门查询等

技术分享

回到 http://localhost:8764/search指定集合查询所有文档

技术分享

点开上面的链接随便在其中找个单词然后在lucid中查询会在索引的Content字段中高亮显示

技术分享

为了验证检索出的索引中确实有这个关键词打开红色的链接页面:

 

https://docs.lucidworks.com/display/fusion/Users+and+Roles 可以发现这个页面确实由我们检索的关键词rest

https://docs.lucidworks.com/display/fusion/Crawling+Websites 

技术分享

技术分享


Index Document(PDF+JSON)

curl -u admin:password123 -X POST -H "Content-Type: application/pdf"

--data-binary @/home/hadoop/Documents/ML/deeplearning.pdf 

http://localhost:8764/api/apollo/index-pipelines/conn_solr/collections/docs/index

上面的命令是连续的要指定usernamepassword, 即登陆fusion的用户名和密码指定-H表示Header

--data-binary指定文件路径注意前面的@. 最后是固定的url, 注意最后的docs表示collection, 必须已经存在

 

执行上述命令会将pdf文档中的内容全部加入lucene的索引中

http://localhost:8764/search/docs?profile=default&q=*&sf=score&sd=desc 

技术分享

可以搜索文档中的某个词来验证比如打开pdf文档找到classifying单词CLASSIFYING

技术分享

验证在fusion中能够搜索到这个文档

技术分享


curl -u admin:password123 -X POST -H "Content-Type: application/vnd.lucidworks-document" -d ‘[{"id":"myDoc1", "fields":[{"name":"title", "value":"My first document"}, {"name":"body", "value":"This is a simple document."}]}, {"id":"myDoc2", "fields":[{"name":"title", "value":"My second document"}, {"name":"body", "value":"This is another simple document."}]}]‘ http://localhost:8764/api/apollo/index-pipelines/conn_solr/collections/docs/index

技术分享





Hello Lucid Fusion

标签:search

原文地址:http://blog.csdn.net/zqhxuyuan/article/details/42775203

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!