标签:发布 高效 google main 计算 tip 优势 amp 数据集
谢邀。现在优秀的算法很多,也有很多研究者在结合一些优秀的算法思考能不能碰撞出美丽的火花,DPN算是将DenseNet和ResNext结合得不错的算法,以ResNext算法为主框架,引入DenseNet的思想不是空穴来风,背后的数学含义更值得思考,没有理论支撑的话,蒙头融合模型很多时间知识浪费时间。
结合了ResNext和DenseNet
不过我在K40上测试,DPN98的训练速度只有8.64 samples/sec;resnext101(64*4d)却有9.31 samples/sec。
当然,显存占用和模型大小确实是DPN98要小于resnext101(64*4d)的。
25%的计算成本在哪里体现呢?
(答:显存小,增大batchsize,可以增加计算的有效性,加大samples/sec的值)测试是K40 DPN可以达到0.10s resnext101要0.13,DPN的模型也要小一些;提升还是有的,应该主要是训练过程中的数据处理影响了时间。
from:https://www.zhihu.com/question/62282589
标签:发布 高效 google main 计算 tip 优势 amp 数据集
原文地址:https://www.cnblogs.com/bonelee/p/9031623.html