码迷,mamicode.com
首页 > 其他好文 > 详细

【每一个人都是梵高】A Neural Algorithm of Artistic Style

时间:2017-08-06 19:38:11      阅读:137      评论:0      收藏:0      [点我收藏+]

标签:.text   tail   href   atom   oss   markdown   ext   0.00   ddc   

文章地址:A Neural Algorithm of Artistic Style
代码:https://github.com/jcjohnson/neural-style

这篇文章我认为可以起个浪漫的名字——每一个人都是梵高。
主要做的一件事情非常有意思。就是例如以下图的等式,通过将a图的style和p图的content进行融合。得到第三幅图x。style+content=styled content
技术分享
怎么做呢?首先他定义了两个loss。分别表示终于生成的图x和style图a的样式上的loss,以及x和content图p的内容上的loss。α,β是调节两者比例的參数。终于的loss function是两者的加和。

通过optimize总的loss求得终于的x。


技术分享

Details

所用的CNN网络是VGG-16,利用了它16个卷积层和5个pooling层来生成feature。
如果某一层得到的响应是FlRNl?Ml,当中Nl为l层filter的个数,Ml为filter的大小。Flij表示的是第l层第i个filter在位置j的输出。

content loss

如果p和x在CNN中的响应分别为Pl和Fl。将他们内容上的loss表示成每一个pixel的二范数:
技术分享
则用梯度下降法,content loss对F求导为:
技术分享

Style Loss

图x的style表示为GlRNl?Nl,当中Glij=kFlik?Fljk,即CNN同一层不同filter响应的互相关,至于为什么互相关可以表示style,well。I don’t know….
那么每一层style loss为
技术分享
当中style图a的在CNN中的响应为A。


则总的style loss为每一层的加权和:
技术分享

Total Loss

在定义好了两个loss的形式以后,又回到了最初的问题,就是最小化总的loss:
技术分享
要注意的是。不同于一般的CNN优化,这里优化的參数不再是网络的w和b。而是初始输入的一张噪声图片x
技术分享
终于我们想让他变成右图这样styled content。

Experiments

  1. 对同一张content图片运用不同style的结果例如以下图所看到的,fantastic!!
    技术分享

  2. total loss中αβ的比例:
    从上到下表示的是运用不同conv层的feature进行style,conv1->conv5是一个从总体到局部的过程;
    从左到右表示的是不同的α/β的比例,10?5->10?2是指更注重style还是更强调content。
    技术分享

【每一个人都是梵高】A Neural Algorithm of Artistic Style

标签:.text   tail   href   atom   oss   markdown   ext   0.00   ddc   

原文地址:http://www.cnblogs.com/liguangsunls/p/7295468.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!