官方网址:
https://github.com/OpenRefine/OpenRefine/wiki/Installation-Instructions#linux
1、下载对应平台的安装包
2、解压
3、运行(Linux下直接运行./refine)
4、输入127.0.0.1:3333即可访问Google Refine的网址
5、如果需要接收任何ip地址发出的请求,需要在命令行运行时输入./refine -i0.0.0.0
在http://refine.deri.ie/下载RDF Refine的extension包,放在Google Refine的webapp/extensions里面。重启Google Refine
在Project管理页面右上角看到下图所示RDF选项,说明加载成功。
点击右上角RDF,选择Add reconciliationservice,在选择based on SPARQL
按照下图所示填写详细信息
注意Endpoint Type选择Virtuoso
在reconciliation结果的优化中可以对Label properties进行选择,可以选择other,然后手动键入URI
如下图所示的上传内存中,我们点击name那里的下拉按钮,选择startreconciliation
然后选择DBpedia,经过一番计算与处理之后,中央的一个列表给出了一系列类型候选项。选择一项我们认为最为认可的type。
在持续了8分钟(具体耗时根据网络状况而定)的信息抽取与处理之后,pre-reconciliation终于给了我们一个列表:
我们选择dbo:Book这个类型,然后为了简便起见,直接点击StartReconciliation
这个提示框告诉我们reconciliation过程的进度
如下图所示,我们已经部分完成了reconciliation的过程
左侧边栏:
在name一栏有匹配到book name与未匹配到任何信息两类数据,exclude为删除对应的条目。
而下方的柱状图表可以用来拖拽,显示不同候选分值的条目用来显示。同时,点击change,我们可以对分值进行修改与自定义计算。
这里的两个勾选可以对user认为正确的条目进行确认。
在下面这个条目中有很多候选选项,本身的名字非常具有歧义性,所以需要用户进行更为细致的确认。
点击其中的候选项,查看详细信息。通过作者的匹配,基本上确认这本书在DBpedia中的具体条目。
同样对作者一栏进行reconciliation
结果中只有一个条目没有得到对应的匹配结果,我们选择新建这个条目
接下来定义schema信息
修改Base URI
添加主语属性:
添加类型信息:
点击这里的property修改谓语属性URI,先点击其中一个输入dc:title,点击确定加载,然后再相同操作输入一遍即可选择对应的谓语URI
修改后如下:
点击preview即可进行预览:
这里可以修改每一个宾语的类型信息。
添加一个property:
对添加的谓语所对应的宾语进行设置:
preview/edit对话框中,输入cell.recon.match.id
此时在预览框我们看到了和DBpedia中URI的对应关系:
添加另外一个属性:foaf:maker,同时选中Used As a URI
在预览框中我们可以看到新添加的内容:
我们点击OK,结束RDF Skeleton过程。
最后点击Export,选择RDF/XML,导出为RDF XML文件。
RDF Refine(Open Refine + RDF Refine)使用笔记
原文地址:http://blog.csdn.net/rk2900/article/details/39180743