标签:pre loading pac baidu 括号 sof not sim root
主要介绍GCN-Tree模型中依存树的内容。论文中使用的工具来自Standford Parser。
http://nlp.stanford.edu:8080/parser/ 这是可以体验功能。
工具包:https://nlp.stanford.edu/software/stanford-dependencies.shtml 教你怎么用stanford dependency parser这个工具代码。
图2:用图卷积网络抽取关系。左侧显示整体架构,而右侧则只显示“relative”一词的详细图卷积计算,以求清晰。本文还提供了一个完整的、未标记的句子依存分析,以供参考。
我们使用论文中的例子还原一下这个解析树:
(ROOT (S (NP (PRP He)) (VP (VBD was) (RB not) (NP (NP (DT a) (NN relative)) (PP (IN of) (NP (NNP Mike) (NNP Cane)))))))
nsubj(relative-5, He-1) cop(relative-5, was-2) advmod(relative-5, not-3) det(relative-5, a-4) root(ROOT-0, relative-5) case(Cane-8, of-6) compound(Cane-8, Mike-7) nmod(relative-5, Cane-8)
nsubj(relative-5, He-1) cop(relative-5, was-2) advmod(relative-5, not-3) det(relative-5, a-4) root(ROOT-0, relative-5) case(Cane-8, of-6) compound(Cane-8, Mike-7) nmod:of(relative-5, Cane-8)
可以看到第5个单词relative作为根节点,nsubj,cop,avvmod,det,root,case,compound,nmod:of作为依赖边关系表示缩写,在论文数据集中标注为$stanford_deprel$
括号前边的项为关系边的出发点,后项为这句子中的第X个单词(head,此单词),head在论文数据集中标注为$stanford_head$
取自数据集中某条数据:
这样可以写出universal dependencies:
nsubj(named-2,He-1)
root(ROOT-0,named-2)
dobj(named-2,one-3)
case(Aziz-7,as-4)
compound(Aziz-7,Shah-5)
compound(Aziz-7,Shah-6)
compound(Aziz-7,Shah-7)
nmod(named-2,Aziz-7)
通过工具验证一下:
(ROOT (S (NP (PRP He)) (VP (VBD named) (NP (CD one)) (PP (IN as) (NP (NNP Shah) (NNP Abdul) (NNP Aziz))))))
nsubj(named-2, He-1) root(ROOT-0, named-2) obj(named-2, one-3) case(Aziz-7, as-4) compound(Aziz-7, Shah-5) compound(Aziz-7, Abdul-6) obl(named-2, Aziz-7)
nsubj(named-2, He-1) root(ROOT-0, named-2) obj(named-2, one-3) case(Aziz-7, as-4) compound(Aziz-7, Shah-5) compound(Aziz-7, Abdul-6) obl:as(named-2, Aziz-7)
经验证确实是这样标注的。
都挺简单的数据结构问题(多叉树的节点问题):
a. 已知一个节点怎么找到它的父(子)节点。
这个就很简单了。自己应该会的。
b. 求两个节点的最短路径
就是找到一个节点,把自己和所有父节点放到一个数组里,再在另一个节点,从本身开始顺着父节点找,直到找到和第一个节点并且存在于第一个数组里,这样,第一个数组从0开始到这个公共节点和第二个节点的从这个节点到自己本身的所有节点就是这俩节点的最短路径。
举个实在例子(意见抽取):
dependency tree是:
属性之间的最短路径:
注意的是,这个路径上每次经过的线(也就是他们俩的关系),这里的路径就是这个。
属性与评价之间的最短路径:
从这两组最短路径很明显看出谁跟谁更亲近,这也是最短路径的一个应用。
参考:
详解依存树的来龙去脉:https://blog.csdn.net/qq_27590277/article/details/88345017
Standford依存句法详细解释:http://wenku.baidu.com/link?url=IfW-hkMfPuK29t49Wa_nO2UAMpP2oGYCUAZuY5PrHHIQHsIm5moH82DMbTA521PMhCC4svgGRSgUTaSkHktw5Ru6RQCCRjwuHfkNVB3mcum
标签:pre loading pac baidu 括号 sof not sim root
原文地址:https://www.cnblogs.com/Harukaze/p/14274720.html