清华大学-刘知远：表示学习与知识获取

时间：2019-02-20 21:25:09 阅读：284 评论：0 收藏：0 [点我收藏+]

标签：生成 mic nlp 输入自动 ati img 挖掘 info

---恢复内容开始---

分布式表示优势：

技术图片

在一段文本当中，进行实体抽取：实际是在计算词汇与文档之间的相似度。

自动摘要技术：是在计算句子与文档之间的相似度。

优势2:由表层的数据，关联关系，能够进一步挖掘出数据底层的深层语义，因果关系。

————————————————————————————————————————

NLP的任务：标注、理解、生成。

从多源异构的文本中，依次进行词汇表示、网络表示、知识表示。

其中词汇表示，包括实体、短语、文档、词义、句子的表示。

技术图片

下面详细讲一讲词汇的表示。

word2Vec 主要包括2个模型

cbow: 知道一个词的前两个词和后两个词，推导出该词。

skip-gram: 知道改词，推导其前后两个词。

技术图片

分布式词表示学习模型，可以进行词汇相似度的计算。比如，输入China ,计算如下。

技术图片

词汇表示还可以发现词汇间的隐含关系

技术图片

词汇表示还可以发现词汇之间的语义层级关系

技术图片

跨语言词汇联合表示

技术图片

视觉-文本联合表示

技术图片

一个有意思的任务：给你一张图，生成该图的一句话的简要描述。image caption generation

词汇语义变迁研究

技术图片

——————————————————————————————————————————————————————————————

知识表示：

技术图片

知识表示与关系抽取

融合文本与知识进行关系抽取
利用关系路径进行关系抽取
利用远程监督多实例进行关系抽取

技术图片

融合文本与知识进行关系抽取

技术图片

融合实体描述的知识表示

技术图片

zero-shot场景下的关系预测

技术图片

---恢复内容结束---

清华大学-刘知远：表示学习与知识获取

标签：生成 mic nlp 输入自动 ati img 挖掘 info

原文地址：https://www.cnblogs.com/vector11248/p/10409161.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行