googleNet是2014年的ILSVRC的冠军模型,GoogleNet做了更大胆的网络上的尝试,而不是像vgg继承了lenet以及alexnet的一切框架。GoogleNet虽然有22层,但是参数量只有AlexNet的1/12 GoogleNet论文指出 获得高质量模型最保险的做法就是增加模型的 ...
分类:
Web程序 时间:
2020-05-20 20:29:30
阅读次数:
169
GoogleNet和VGG是ImageNet挑战赛中的第一名和第二名。共同特点就是两个网络的层次都更深了。但是: VGG继承了LeNet和AlexNet的一些框架结构 而GoogleNet则做了更大胆的尝试,虽然深度有22层,但是参数却是Alexnet的1/12.而VGG都是Alexnet的三倍,由 ...
分类:
Web程序 时间:
2020-05-20 20:22:25
阅读次数:
85
auto : 神经网络结构搜索(NAS) ImageNet 上Top1-acc Top5-Acc auto version arxiv Top1-Acc Top5-Acc Params VGG GoogleNet inception-v1 https://arxiv.org/pdf/1409.484 ...
分类:
其他好文 时间:
2020-05-18 22:21:40
阅读次数:
152
梳理一遍,还需补充哪些欢迎指出。 指标 MS COCO 一、单阶段目标检测(基于anchor的) multi-scale backbone arxiv/ github 机构 AP AP50 AP75 APs APM APL 亮点 time YOLO DarkNet-53 SSD300 VGG htt ...
分类:
其他好文 时间:
2020-05-18 00:32:04
阅读次数:
273
CTPN是CNN+RNN的结合,CNN主要是用于文本框的提取,RNN将中间层的输入结果进行改变,保证文本框的上下文具有联系 网络结构 网络结构说明: 首先使用VGG,将原来图片的大小,缩小为1/16,因此每一个点输出结果是2*10概率和2*10的位置信息 标签制作: 构造16个像素,从上到下构造an ...
分类:
编程语言 时间:
2020-05-05 23:34:31
阅读次数:
104
python版本2.7 TensorFlow版本:0.8.0rc0(输入tf.__version__即可查看) 由于TensorFlow版本较低,个别函数用法已经发生变化,不过无关紧要,出现错误网上都有解决方法。 原始图片和预处理图片: top5分类: 代码: ...
分类:
其他好文 时间:
2020-05-05 11:10:36
阅读次数:
64
最初目的:搞清楚网络深度与模型的识别精度和准确率之间的关系。 获得的结果:不能无限制的加深网络,在网络加深到一定层数之后就会出现训练效果褪化、梯度消逝或者梯度爆炸等问题。 主要的贡献: 1、提出用多层3 x 3的卷积层来替换大尺寸的卷积核,从而提升网络深度。 2、使用1 x 1的卷积核进行各通道的特 ...
分类:
其他好文 时间:
2020-04-01 16:25:19
阅读次数:
91
深度学习在广泛应用于目标检测、分类等计算机视觉任务中。但这些应用往往需要很大的计算量和能耗。例如处理一张图片分类,VGG-16需要做 150亿次计算,而YOLOv3需要执行390亿次计算。 这就带来一个问题,如何在低功耗的嵌入式系统或移动设备中部署深度学习呢?一种解决办法是将计算任务转移到云侧,但这 ...
分类:
其他好文 时间:
2020-03-31 20:43:28
阅读次数:
95
# fer2013数据集 ## 数据集介绍
* Fer2013人脸表情数据集由35886张人脸表情图片组成,其中,测试图(Training)28708张,公共验证图(PublicTest)和私有验证图(PrivateTest)各3589张,每张图片是由大小固定为48×48的灰度图像组成,共有7种表情... ...
分类:
Web程序 时间:
2020-03-30 19:45:47
阅读次数:
721
Very Deep Convolutional Networks for Large-Scale Image Recognition Karen Simonyan? & Andrew Zisserman+ Visual Geometry Group, Department of Engineerin ...
分类:
Web程序 时间:
2020-03-30 09:29:43
阅读次数:
135