码迷,mamicode.com
首页 > 其他好文 > 详细

【神经网络】依存树

时间:2021-01-14 11:25:39      阅读:0      评论:0      收藏:0      [点我收藏+]

标签:pre   loading   pac   baidu   括号   sof   not   sim   root   

主要介绍GCN-Tree模型中依存树的内容。论文中使用的工具来自Standford Parser。

http://nlp.stanford.edu:8080/parser/  这是可以体验功能。

工具包:https://nlp.stanford.edu/software/stanford-dependencies.shtml  教你怎么用stanford dependency parser这个工具代码。

技术图片

图2:用图卷积网络抽取关系。左侧显示整体架构,而右侧则只显示“relative”一词的详细图卷积计算,以求清晰。本文还提供了一个完整的、未标记的句子依存分析,以供参考。

我们使用论文中的例子还原一下这个解析树:

Your query

He was not a relative of Mike Cane

Tagging

He/PRP  was/VBD  not/RB  a/DT  relative/NN  of/IN  Mike/NNP  Cane/NNP

Parse

(ROOT
  (S
    (NP (PRP He))
    (VP (VBD was) (RB not)
      (NP
        (NP (DT a) (NN relative))
        (PP (IN of)
          (NP (NNP Mike) (NNP Cane)))))))

Universal dependencies

nsubj(relative-5, He-1)
cop(relative-5, was-2)
advmod(relative-5, not-3)
det(relative-5, a-4)
root(ROOT-0, relative-5)
case(Cane-8, of-6)
compound(Cane-8, Mike-7)
nmod(relative-5, Cane-8)

Universal dependencies, enhanced

nsubj(relative-5, He-1)
cop(relative-5, was-2)
advmod(relative-5, not-3)
det(relative-5, a-4)
root(ROOT-0, relative-5)
case(Cane-8, of-6)
compound(Cane-8, Mike-7)
nmod:of(relative-5, Cane-8)

可以看到第5个单词relative作为根节点,nsubj,cop,avvmod,det,root,case,compound,nmod:of作为依赖边关系表示缩写,在论文数据集中标注为$stanford_deprel$

括号前边的项为关系边的出发点,后项为这句子中的第X个单词(head,此单词),head在论文数据集中标注为$stanford_head$

取自数据集中某条数据:

技术图片

这样可以写出universal dependencies:

nsubj(named-2,He-1)

root(ROOT-0,named-2)

dobj(named-2,one-3)

case(Aziz-7,as-4)

compound(Aziz-7,Shah-5)

compound(Aziz-7,Shah-6)

compound(Aziz-7,Shah-7)

nmod(named-2,Aziz-7)

通过工具验证一下:

Your query

He named one as Shah Abdul Aziz

Tagging

He/PRP  named/VBD  one/CD  as/IN  Shah/NNP  Abdul/NNP  Aziz/NNP

Parse

(ROOT
  (S
    (NP (PRP He))
    (VP (VBD named)
      (NP (CD one))
      (PP (IN as)
        (NP (NNP Shah) (NNP Abdul) (NNP Aziz))))))

Universal dependencies

nsubj(named-2, He-1)
root(ROOT-0, named-2)
obj(named-2, one-3)
case(Aziz-7, as-4)
compound(Aziz-7, Shah-5)
compound(Aziz-7, Abdul-6)
obl(named-2, Aziz-7)

Universal dependencies, enhanced

nsubj(named-2, He-1)
root(ROOT-0, named-2)
obj(named-2, one-3)
case(Aziz-7, as-4)
compound(Aziz-7, Shah-5)
compound(Aziz-7, Abdul-6)
obl:as(named-2, Aziz-7)

经验证确实是这样标注的。

两个基本问题

都挺简单的数据结构问题(多叉树的节点问题):

a. 已知一个节点怎么找到它的父(子)节点。

这个就很简单了。自己应该会的。

b. 求两个节点的最短路径

就是找到一个节点,把自己和所有父节点放到一个数组里,再在另一个节点,从本身开始顺着父节点找,直到找到和第一个节点并且存在于第一个数组里,这样,第一个数组从0开始到这个公共节点和第二个节点的从这个节点到自己本身的所有节点就是这俩节点的最短路径。

举个实在例子(意见抽取):

技术图片

dependency tree是:

技术图片

技术图片

属性之间的最短路径:

技术图片

注意的是,这个路径上每次经过的线(也就是他们俩的关系),这里的路径就是这个。

属性与评价之间的最短路径:

技术图片

从这两组最短路径很明显看出谁跟谁更亲近,这也是最短路径的一个应用。

 

 

 

参考:

详解依存树的来龙去脉:https://blog.csdn.net/qq_27590277/article/details/88345017 

Standford依存句法详细解释:http://wenku.baidu.com/link?url=IfW-hkMfPuK29t49Wa_nO2UAMpP2oGYCUAZuY5PrHHIQHsIm5moH82DMbTA521PMhCC4svgGRSgUTaSkHktw5Ru6RQCCRjwuHfkNVB3mcum

【神经网络】依存树

标签:pre   loading   pac   baidu   括号   sof   not   sim   root   

原文地址:https://www.cnblogs.com/Harukaze/p/14274720.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!