码迷,mamicode.com
首页 >  
搜索关键字:文字检测    ( 19个结果
动手-文字检测-PSENet
借助mmocr框架,测试几种算法的效果。 这是一个文字检测和文字识别库,集成了很多的模型,包括PSENet、PixelLink等等 安装参考 https://mmocr.readthedocs.io/en/latest/install.html (base) xuehp@haomeiya009:~/ ...
分类:Web程序   时间:2021-04-26 13:44:18    阅读次数:0
第九届软件杯(第二批)基于深度学习的企业实体识别
本赛题分为三个模块:文字检测、文字识别、命名实体识别。 赛题要求将图片中的所有文字检测并识别出来,并从识别出的文字中提取出企业名称。 文字检测模块 数据准备 ICDAR2019-LSVT数据集,下载并解压后的数据集如下: ~/train_data/LSVT/text_localization └─ ...
分类:其他好文   时间:2020-11-19 12:52:24    阅读次数:10
OCR场景文本识别:文字检测+文字识别
一. 应用背景 OCR(Optical Character Recognition)文字识别技术的应用领域主要包括:证件识别、车牌识别、智慧医疗、pdf文档转换为Word、拍照识别、截图识别、网络图片识别、无人驾驶、无纸化办公、稿件编辑校对、物流分拣、舆情监控、文档检索、字幕识别文献资料检索等。OC ...
分类:其他好文   时间:2020-03-06 17:51:21    阅读次数:90
实现text-detection-ctpn一路的坎坎坷坷
小编在学习文字检测,因为作者提供的caffe实现没有训练代码(不过训练代码可以参考faster-rcnn的训练代码),所以我打算先使用tensorflow实现,主要是复现前辈的代码,主要是对文字检测模型进行训练。 代码的GitHub地址:https://github.com/eragonruan/t ...
分类:其他好文   时间:2018-12-05 12:12:10    阅读次数:581
文字识别:CRNN
知乎:一文读懂CRNN+CTC文本行识别 (详解 CTC loss) 来自: https://zhuanlan.zhihu.com/p/43534801 文字检测主要解决的问题是哪里有文字,文字的范围有多大,即定位文本行的所在位置和范围及其布局。 文本识别是在文本行定位的基础上,对文本行内容进行识别 ...
分类:其他好文   时间:2018-11-26 13:48:37    阅读次数:342
Andrew Ng-ML-第十九章-应用举例:照片OCR(光学字符识别)
1.问题描述与 OCR pipeline 图1.图像文字识别流水线 首先是输入图片-》进行文字检测-》字符分割-》字符识别。 这些阶段分别需要1-5人这样子。 2.滑动窗口 主要讲滑动窗口分类器。 图2.滑动窗口检测 对于行人检测来说,矩阵框有长宽相同的比例,虽然具体的数值会变化,但比例不变;但是对 ...
分类:其他好文   时间:2018-08-21 21:06:38    阅读次数:171
【谱聚类算法总结】
前言:以前只是调用过谱聚类算法,我也不懂为什么各家公司都问我一做文字检测的这个算法具体咋整的,没整明白还给我挂了哇擦嘞?讯飞和百度都以这个理由刷本宝,今天一怒把它给整吧清楚了,下次谁再问来!说不晕你算我输! 一、解释: 二、推导: 三、步骤: 四、优缺点: 五、链接: https://www.cnb ...
分类:编程语言   时间:2018-08-06 21:00:52    阅读次数:325
图片OCR(Optical Character Recognition)
[toc] Photo OCR问题描述 随着网络上的图片的数量越来越多,读取图片上的文字成为了一个日益增强的需求。 按照photo ocr问题的各个处理流程,我们可以大致为不同的环节分配不同数量的人去进行。 滑动窗口(Sliding Windows) 文字检测和行人检测的差别: 行人由于其矩形的长宽 ...
分类:其他好文   时间:2018-07-07 15:38:30    阅读次数:189
图像文字识别(OCR)用什么算法小结
说明:主要考虑深度学习的方法,传统的方法不在考虑范围之内。 1.文字识别步骤 1.1detection:找到有文字的区域(proposal)。 1.2classification:识别区域中的文字。 2.文字检测 文字检测主要有两条线,两步法和一步法。 2.1两步法:faster-rcnn. 2.2 ...
分类:编程语言   时间:2018-06-19 22:50:04    阅读次数:610
扭曲形状文字检测——Sliding Line Point Regression for Shape Robust Scene Text Detection
一、整体网络结构 二、细节 n=7,(7+7)*2+4=32个channel 三、结果 四、总结 1、不做连线的话只能水平方向 2、连线可以多方向,但可能是扭曲的不规则形状 3、两阶段的回归,提高准确率 五、问题 1.回归的扭曲的多边形形状怎么算的f值??? ...
分类:其他好文   时间:2018-04-09 21:47:59    阅读次数:727
19条   1 2 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!