"github博客传送门" "csdn博客传送门" 论文在此: Deep Residual Learning for Image Recognition 论文下载: "https://arxiv.org/pdf/1512.03385.pdf" 网络结构图: Pytorch代码实现: ...
分类:
Web程序 时间:
2018-12-16 18:19:08
阅读次数:
485
Tesseract的安装及配置 在Python爬虫过程中,难免遇到各种各样的验证码问题,最简单的就是?这种验证码了,那么在遇到验证码的时候该怎么办呢?我们就需要OCR技术了,OCR-即Optical Character Recognition光学字符识别,是指通过扫描字符,然后将其形状翻译成电子文本 ...
分类:
编程语言 时间:
2018-12-15 13:41:07
阅读次数:
392
本文来自《Large Margin Softmax Loss for Convolutional Neural Networks》,时间线为2016年12月,是北大和CMU的作品。 0 引言 过去十几年,CNN被应用在各个领域。大家设计的结构,基本都包含卷积层和池化层,可以将局部特征转换成全局特征, ...
分类:
其他好文 时间:
2018-12-14 15:00:50
阅读次数:
194
OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR)。可以实现OCR 的底层库并不多,目前很多库都是使用共同的几个底层OCR 库,或者是在上面进行定制。 Tesseract 是一个OCR 库,目前由Google ...
分类:
编程语言 时间:
2018-12-06 14:38:41
阅读次数:
193
一、Face Recognition软件包 我们的人脸识别基于face_recognition库。face_recognition基于dlib实现,用深度学习训练数据,模型准确率高达99.38%。 人脸数字化 人脸识别的第一步是检测照片中的人脸区域,然后将人脸的图像数据转换成一个长度为128的向量, ...
分类:
编程语言 时间:
2018-11-30 13:51:12
阅读次数:
217
承接上上篇博客,在其基础上,加入了Wasserstein distance和correlation prior 。其他相关工作、网络细节(maxout operator)、训练方式和数据处理等基本和前文一致。以下是这两点改进的大概: Wasserstein convolutional neural ...
分类:
其他好文 时间:
2018-11-25 20:07:39
阅读次数:
884
论文标题:An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 论文作者: Baoguang Shi, Xia ...
分类:
移动开发 时间:
2018-11-24 20:54:22
阅读次数:
310
查找异质图像匹配的过程中,发现几篇某组的论文,都是关于NIR-VIS的识别问题,提到了许多处理异质图像的处理方法,网络结构和idea都很不错,记录其中一篇。 摘要 VIS-NIR(可见光与近红外)面部识别仍然是异质图像识别中的挑战。本文只用一个网络来映射NIR和VIS图像至一个紧凑的欧式空间。网络的 ...
分类:
其他好文 时间:
2018-11-23 14:25:08
阅读次数:
332
OCR简介熟悉OCR的人都了解,OCR大致分为两个部分: -文字提取text extractor -文字识别text recognition 其中,第一部分是属于图像处理部分,涉及到图像分割的知识,而第二部分则大多数利用谷歌的Tesseract来进行字符的识别,设计到的东西不多,当然也不难,难的是要 ...
分类:
其他好文 时间:
2018-11-15 17:13:26
阅读次数:
250
spectral analysis和formants,倒频谱,mel谱等feature有关; training和recognition涉及到:基础的(DWT,HMM,Viterbi等);高阶的(deep learning等)。 ...
分类:
其他好文 时间:
2018-11-10 10:49:34
阅读次数:
247