码迷,mamicode.com
首页 > 其他好文 > 详细

End-to-End Multi-Task Learning with Attention(CVPR2019)

时间:2020-02-21 12:42:09      阅读:84      评论:0      收藏:0      [点我收藏+]

标签:bsp   特征   特定   --   学习   组成   端到端   体系   成功学   

Multi-Task Attention Network(MTAN)--包含全局特征池的共享网络、每个任务的软注意模块

优点:可以端到端训练、可以建立在任意前馈神经网络上、实现简单、参数效率高

背景:

与标准的单任务学习相比,在成功学习到共享表示的同时训练多任务有两个主要的挑战:

1)网络结构(如何共享):

多任务学习体系结构应该同时表达任务共享和任务特定的特性。通过这种方式,网络被鼓励学习一个通用的表示(以避免过度拟合),同时还提供了学习针对每个任务的特性的能力(以避免欠拟合)

2)损失函数(如何平衡任务):

一个多任务损失函数,它对每个任务的相对贡献进行加权,应该使所有任务的学习具有同等的重要性,而不是让更容易的任务占主导地位。手动调整损耗权值是繁琐的,最好是自动学习权值,或者设计一个对不同权值具有鲁棒性的网络。

MTAN网络结构组成:

MTAN由两个部分组成:单个共享网络和K个任务特定注意力网络。共享网络可以根据特定的任务进行设计,而每个具体子任务的网络由一组注意力模块组成,这些注意力模块与共享网络相连接。每个注意力模块对共享网络的特定层应用一个软注意掩码,以学习特定于任务的特性。因此,注意力掩码可以看作是来自共享网络的特征选择器,它以端到端的方式自动学习,而共享网络则跨所有任务学习一个紧凑的全局特性池。

 

End-to-End Multi-Task Learning with Attention(CVPR2019)

标签:bsp   特征   特定   --   学习   组成   端到端   体系   成功学   

原文地址:https://www.cnblogs.com/zwp-28/p/12340780.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!