Convolutional Pose Machines（理解）

时间：2018-11-30 20:03:58 阅读：700 评论：0 收藏：0 [点我收藏+]

　　人体姿态识别存在遮挡以及关键点不清晰等主要挑战，然而，人体的关键点之间由于人体结构而具有相互关系，利用容易识别的关键点来指导难以识别关键点的检测，是提高关键点检测的一个思路。本文通过提出序列化结构模型，来提高人体姿态识别任务的效果。

　　Convolutional Pose Machines（CPM）算法思想来自于Pose Machine，其网络结果如下图：

技术分享图片

　　图中(a)和(b)是pose machine中的结构，(c)和(d)是其对应的卷积网络结构，(e)展示了图片在网络中传输的不同阶段的感受野。

Stage 1：对输入图片做处理，其中$X$代表经典的VGG结构，并且最后采用$1 \times 1$卷积输出belief map，如果人体有$k$个关键带来，则$belief map$的通道数为$k$
Stage T：对于Stage 2以后的Stage，其结构都统称为Stage T，其输入为上一个Stage的输出以及对原始图片的特征提取的联合，输出于Stage 1一致

技术分享图片