搜索关键字：recognition，搜索到462个结果！码迷,mamicode.com！

ResNet(Pytroch实现)

"github博客传送门" "csdn博客传送门" 论文在此: Deep Residual Learning for Image Recognition 论文下载: "https://arxiv.org/pdf/1512.03385.pdf" 网络结构图: Pytorch代码实现: ...

分类：Web程序时间：2018-12-16 18:19:08 阅读次数：485

Python安装tesserocr遇到的各种问题及解决办法

Tesseract的安装及配置在Python爬虫过程中，难免遇到各种各样的验证码问题，最简单的就是?这种验证码了，那么在遇到验证码的时候该怎么办呢？我们就需要OCR技术了，OCR-即Optical Character Recognition光学字符识别，是指通过扫描字符，然后将其形状翻译成电子文本 ...

分类：编程语言时间：2018-12-15 13:41:07 阅读次数：392

face recognition[variations of softmax][L-Softmax]

本文来自《Large Margin Softmax Loss for Convolutional Neural Networks》，时间线为2016年12月，是北大和CMU的作品。 0 引言过去十几年，CNN被应用在各个领域。大家设计的结构，基本都包含卷积层和池化层，可以将局部特征转换成全局特征， ...

分类：其他好文时间：2018-12-14 15:00:50 阅读次数：194

Python图像处理之图片文字识别（OCR）

OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别（Optical Character Recognition，OCR）。可以实现OCR 的底层库并不多，目前很多库都是使用共同的几个底层OCR 库，或者是在上面进行定制。 Tesseract 是一个OCR 库，目前由Google ...

分类：编程语言时间：2018-12-06 14:38:41 阅读次数：193

Python 实现人脸识别

一、Face Recognition软件包我们的人脸识别基于face_recognition库。face_recognition基于dlib实现，用深度学习训练数据，模型准确率高达99.38%。人脸数字化人脸识别的第一步是检测照片中的人脸区域，然后将人脸的图像数据转换成一个长度为128的向量， ...

分类：编程语言时间：2018-11-30 13:51:12 阅读次数：217

Wasserstein CNN: Learning Invariant Features for NIR-VIS Face Recognition

承接上上篇博客，在其基础上，加入了Wasserstein distance和correlation prior 。其他相关工作、网络细节（maxout operator）、训练方式和数据处理等基本和前文一致。以下是这两点改进的大概： Wasserstein convolutional neural ...

分类：其他好文时间：2018-11-25 20:07:39 阅读次数：884

深度学习论文翻译解析（二）：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

论文标题：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 论文作者： Baoguang Shi, Xia ...

分类：移动开发时间：2018-11-24 20:54:22 阅读次数：310

Learning Invariant Deep Representation for NIR-VIS Face Recognition

查找异质图像匹配的过程中，发现几篇某组的论文，都是关于NIR-VIS的识别问题，提到了许多处理异质图像的处理方法，网络结构和idea都很不错，记录其中一篇。摘要 VIS-NIR（可见光与近红外）面部识别仍然是异质图像识别中的挑战。本文只用一个网络来映射NIR和VIS图像至一个紧凑的欧式空间。网络的 ...

分类：其他好文时间：2018-11-23 14:25:08 阅读次数：332

OpenCV在字符提取中进行的预处理（转）

OCR简介熟悉OCR的人都了解，OCR大致分为两个部分： -文字提取text extractor -文字识别text recognition 其中，第一部分是属于图像处理部分，涉及到图像分割的知识，而第二部分则大多数利用谷歌的Tesseract来进行字符的识别，设计到的东西不多，当然也不难，难的是要 ...

分类：其他好文时间：2018-11-15 17:13:26 阅读次数：250

人工智能入门（二）：语音识别基本模型

spectral analysis和formants，倒频谱，mel谱等feature有关； training和recognition涉及到：基础的（DWT，HMM，Viterbi等）；高阶的（deep learning等）。 ...

分类：其他好文时间：2018-11-10 10:49:34 阅读次数：247

共462条上一页 1 ... 11 12 13 14 15 ... 47 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)