Boosting Factual Correctness of Abstractive Summarization with Knowledge Graph

时间：2020-05-07 09:21:21 阅读：98 评论：0 收藏：0 [点我收藏+]

链接

https://www.microsoft.com/en-us/research/publication/boosting-factual-correctness-of-abstractive-summarization-with-knowledge-graph/

作者

Chenguang Zhu
Microsoft Speech and Dialogue Research Group

主题

提高生成式文本摘要的事实准确性
(Extractive and Abstractive Summarization 分别是抽取式和生成式)

技术图片

引言

文本摘要模型旨在在保留重要信息的同时生成长文本的精简版本。
- 生成式摘要是这类模型的一种，可以自由生成摘要，而对使用的单词或短语没有任何限制。这种格式更接近于人工编辑的摘要，既灵活又提供了很多信息。
生成式摘要的一个突出问题是事实不一致。它是指摘要有时会歪曲或捏造文章中的事实的现象。(30%的比例会生成事实不一致的)
- 比如如图的例子， Heather Mack帮助男友Tommy Schaefer谋杀了她的母亲，而BOTTOMUP的摘要则表示Schaefer是Tommy Schaefer的男友。模型SEQ2SEQ错误地指出Tommy Schaefer是受害者。
另一方面，大多数现有的生成摘要模型都应用条件语言模型来关注摘要的token-level准确性，而忽略摘要和文章之间的semantic-level一致性。
- 生成的摘要通常具有较高的token-level指标值，例如ROUGE，但缺乏事实正确性。
在本文中，我们以知识图谱的形式表示事实。尽管在构建通用知识图谱以促进知识提取和集成方面已付出了许多努力，例如ConceptNet和WikiData，但我们发现这些工具在授予常识知识方面更有用。在对新闻文章等内容进行抽象总结时，以前看不见许多实体和关系。另外，我们的目标是提供与本文中的事实不冲突的摘要。因此，我们建议从文章本身中提取事实知识。
我们使用信息提取（IE）工具OpenIE（Angeli等人，2015）以关系元组的形式从文章中提取事实：（主体，关系，客体）。此图谱包含文章中的事实，并集成在摘要生成过程中。
然后，我们使用图注意力网络（Veliˇckovi′c et al。，2017）获得每个节点的表示，并通过注意力将其融合到基于transformer的编码器-解码器架构中。最后，它利用copy-generate mechanism从字典或图实体中选择性地产生内容。我们将此模型表示为事实感知摘要模型FASUM。
另外，为了普遍适用于所有现有的摘要系统，我们提出了事实校正器模型FC，以帮助提高任何给定摘要的事实正确性。我们将校正过程定为seq2seq问题：输入是原始摘要和文章，输出是更正的摘要。我们利用预先训练的语言模型UniLM（Dong等人，2019）并将其微调为降噪自动编码器。训练数据是通过用文章中错误的实体随机替换基本摘要中的实体而综合生成的。FC进行了三处更正，用正确的实体替换了文章中其他位置出现的原始错误实体。

在实验中，我们利用了经过独立训练的，基于BERT的（Devlin等人，2018）事实正确性评估器（Kry′sci′nski等人，2019b）。结果显示，在CNN / DailyMail上，FASUM的事实正确性得分比UNILM（Dong等，2019）高1.2％，比BOTTOMUP（Gehrmann等，2018）高4.5％。此外，通过FC校正后，BOTTOMUP的摘要的实际分数在CNN / DailyMail上增加了1.7％，在XSum上增加了1.2％，而TCONVS2S的摘要的分数在XSum上增加了3.9％。我们还将进行人工评估，以验证我们模型的有效性。

方法

形式化

技术图片
其实就是数据集：(文章，摘要)的数据对。给文章，输出摘要。每个文章或者摘要就是一大串token组成。

Factual Correctness Evaluator

我们利用FactCC评估器（Kry′sci′nski et al。，2019b），它将正确性评估映射为二进制分类问题，即找到一个函数
技术图片
其实就是给一个文章和摘要的一句话，输出0和1，对于一个摘要，多句话就取分数的平均。
生成训练数据的思路：正面样本：backtranslation: 摘要-->中间语言-->回译; 负面：我们应用实体交换，否定和代词交换生成否定示例
根据Kry′sci′nski等。（2019b），我们使用相同的超参数微调BERTBASE模型以微调FactCC。我们将文章和生成的声明与特殊标记[CLS]和[SEP]串联在一起。 [CLS]的最终嵌入用于计算claim蕴含在content中的可能性。

Fact-Aware Summarizer

技术图片
encoder-decoder结构，从源文章提取知识融入到摘要生成过程中。

Knowledge Extraction

为了从文章中提取重要的实体关系信息，我们使用了斯坦福大学的OpenIE工具（Angeli等人，2015）。提取的知识是元组列表。每个元组包含一个主题（S），一个关系（R）和一个对象（O），每个都是文章文章的一部分。在实验中，每篇文章平均提取165.4个元组。

Knowledge Representation

技术图片
抽取元组以后，把每个元组都变成三个结点，形成图，然后用graph attention network来获得embedding

knowledge integration

与编码器并行地获得知识图嵌入。然后，除了对编码器输出的规范交叉注意之外，每个解码器块还计算对知识图节点的嵌入的交叉注意：
技术图片

Summary Generation

用了copy-generate机制。
技术图片
要么从词表选词，要么从node中选词

Fact Corrector

技术图片
为了更好地利用现有的摘要系统，我们提出了一个事实校正器模型FC，以提高抽象系统生成的任何摘要的事实正确性。 FC将纠正过程归结为seq2seq问题：给定文章和候选摘要，模型将生成经过更正的摘要，并进行最少的更改以使事实与文章更加一致。

FC的模型架构为UniLM（Dong等，2019），由RoBERTa-Large的权重（Liu等，2019）初始化。微调过程类似于训练去噪自动编码器。我们使用回译和实体交换来生成合成数据。例如，事实摘要中的一个实体会随机替换为该文章中相同类型的另一个实体。修改后的摘要和文章将发送到校正器以恢复原始摘要。在实验中，我们在CNN / DailyMail中生成了3.0M seq2seq数据样本，在XSum中生成了551.0K样本以进行微调。我们在每个数据集中抽取1万个样本进行验证，其余的用于训练。

实验

insights

Relation Matching Rate

在本小节中，我们设计了一个易于计算的事实正确性度量标准，尤其是在没有ground-truth摘要的情况下。当知识图中的关系元组捕获文本中的事实信息时，我们计算摘要中提取的元组的精度。
技术图片
实际就是从生成摘要里面提取的关系，在文章提取的关系中的命中率，我们的度量标准的另一个优点是它不需要提供真实的摘要。

总结

第一：事实准确性评估器！
第二：利用一个事实更正器来实现事实一致！！建模为一个seq2seq问题！
第三：利用openIE提取实体关系建立图谱，并融入到摘要生成中。
第四：怎么构造负样本！！！！来训练事实更正器和评估器！！！backtranslation + 实体替换！

Boosting Factual Correctness of Abstractive Summarization with Knowledge Graph

标签：log network 方法校正 eval rman 限制修改 ima

原文地址：https://www.cnblogs.com/doragd/p/12840255.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

Boosting Factual Correctness of Abstractive Summarization with Knowledge Graph

链接

作者

主题

引言

相关工作

事实感知的摘要

方法

形式化

Factual Correctness Evaluator

Fact-Aware Summarizer

Knowledge Extraction

Knowledge Representation

knowledge integration

Summary Generation

Fact Corrector

实验

insights

Relation Matching Rate

总结