总结:关于URI的构成,命名空间,命名空间prefix,curie,turtle,关于RDFa
语义网Semantic web:目的是想构建一个web使所有的data都有一个标准的格式
RDF Resource Description Framework:是一个KB
基于:entity,classes,二元关系,labels
YAGO:是KB,目的是自动从维基百科或者其他网站提取有用的信息
NELL:language learner自动做信息提取
DBpedia:和yago目的一样
Wikidata:创建KB,使data能被机器和人修改
BabelNet:建立多语言本体 multilingual
关于URI
命名空间namespace:名字的集合
例如:命名空间的名字:KB1,命名空间里面包含:Elvis,BABA,etc
本地名称:命名空间里面包含的那些名字
限定名称qualified name:命名空间的名字+本地名字
例如:KB1:Elvis
URI Unified Resource Identifier:
例如:
所有的URL是URI,但不是所有的URI都是URL。
关于命名空间:http://elvis.is/king/of/sing
http://elvis.is是WW映射到domain owner的
剩下的部分是域名所有者的责任
不允许有重叠的词
URI完全不ambiguity
可以synonym,一个东西可以被多个URI指向,但是同一个URI只指向一个东西
namespace prefix:URI的第一部分 例如 @prefix dbp:www.dbpedia.org
curie/Qname:prefix的名字+localname 例如 dbp:Elvis 代表了www.dbpedia.org/Elvis
base URI:URI的第一部分
Turtle:一种RDF的特殊写法
例如
@prefix P:<URI>.
@base <URI>.
或者定义一个litteral的类型
例如”literal”??datatype 这里的datatype是由URI或者CURIE给出
或者: y:Elvis y:loves y:Priscilla .
KB可以描述不同KB之间entity的关系,比如利用turtle
例如: @prefix P:<URI>.
@base<URI>.
KB可以定义其他KB中的entity
Deferenceable URI/Cool URI : 在RDF客户端访问该URI,会返回URI的片段
KB alignment:将一个KB中的实例标签等等,映射到另一个KB中
算法:
- literrals匹配
- 假设他们对应的relation是匹配的
n local functionality:1/y:r(x,y) 一个x有连了多少个y 值越大越好
n inverse functionality:1/x :r(x,y) 一个y被多少个x链接 值越大越好
n functionnality:x连到y的个数/xy之间的连线数
- 若inverse functionality特别高,则算匹配
- 若两个relation的overlap的sbj和obj特别多则算匹配
- 算subsumption的class
- 循环
Linked Data:让机器访问KB
RDFa:把HTML注释成RDF
- vocab来定义HTML里node中的local name
- ressource定义HTML里的subj
- typeof定义HTML里subj的类型
- property定义HTML subj的URI
- property+typeof定义新的entity
RDFa好处:无重复,publisher是独立的
JSON Based RDF :JSON格式的RDF
RDF的写法 A—rdf:type—>B
DublinCore:描述文件的entities的KB
例如:dc:creator, dc:title, dc:format,
schema.org:KB
Creative Commons : RDF
每个人都可以建立URI
URI做distinct是没意义的,它本身就是Disambiguous的