放假了,终于可以继续可以静下心写一写OCR方面的东西。上次谈到文字的切割,今天打算总结一下我们怎么得到用于训练的文字数据集。如果是想训练一个手写体识别的模型,用一些前人收集好的手写文字集就好了,比如中科院的 "这些数据集" 。但是如果我们只是想要训练一个专门用于识别印刷汉字的模型,那么我们就需要各种 ...
分类:
其他好文 时间:
2018-02-09 23:50:35
阅读次数:
987
[抄题]: [思维问题]: [一句话思路]: [输入量]:空: 正常情况:特大:特小:程序里处理到的特殊情况:异常情况(不合法不合理的输入): [画图]: [一刷]: [二刷]: [三刷]: [四刷]: [五刷]: [五分钟肉眼debug的结果]: [总结]: [复杂度]:Time complexi ...
分类:
其他好文 时间:
2018-02-09 22:22:26
阅读次数:
116
为了可以让规则结果可以被重用,可以使用()封装,使用\n调用 有四个组(有几个左括号,就有几个组), 第一个组:第一个左括号 第二个组:第二个左括号 第三个组:第三个左括号 都四个组:第四个左括号 正则的优点:简化代码 正则的缺点:阅读性差 ...
分类:
其他好文 时间:
2018-02-09 17:17:17
阅读次数:
167
tomcat日志切割和定期删除在tomcat的软件环境中,如果我们任由日志文件无限增长,总有一天会将磁盘占满的(废话)。特别是在日志文件增长速度很快的一些情况下,按日志切割日志文件并删除,就是一件很有必要的工作了,以下介绍了切割日志文件的方法。第1章 系统环境1.1 操作系统环境[root@server1 ~]# cat /etc/redhat-release
Cen
分类:
其他好文 时间:
2018-02-09 15:36:11
阅读次数:
210
rsync同步工具rsync-av[源文件][目标文件或目录名]rsync-av[源文件][username@ipaddress:目标文件]-a包含-rtplgoD-r同步目录时用,类似cp的-r-v同步时显示信息-l保留软链接-L同步软链接时,也同步源文件-p保持文件的权限属性-o保持文件的属主-g保持文件的属组-D保持设备文件信息-t保持文件的时间属性--exclude"abcd&q
分类:
其他好文 时间:
2018-02-07 19:34:59
阅读次数:
147
1 //--------------------数组转字符串--------------------------- 2 3 //需要将数组元素用某个字符连接成字符串 4 var a1, b1,c1; 5 a1 = ["a","b","c","d","e"]; 6 b1 = a1.join('-');... ...
分类:
编程语言 时间:
2018-02-05 14:34:31
阅读次数:
172
最近期末考试考完了,我们也要放寒假了。于是突发奇想,想用PHP写一个答题卡识别程序。已经实现了一些,现分享给大家。 具体的步骤如下: 上传答题卡=>图片二值化(已实现)=>寻找定位点(已实现)=>使用定位点切割掉不要的部分(已实现)=>切割小题=>客观题自动阅卷&主观题切割后交由阅卷老师批改=>统计 ...
分类:
Web程序 时间:
2018-02-04 17:59:46
阅读次数:
343
apache [ httpd.conf ]配置文件 #ErrorLog "logs/error.log" ErrorLog "|bin/rotatelogs.exe -l logs/error-%Y-%m-%d.log 2M" Windows下虚拟主机的日志切割 更改后 或者使用下面这种 ...
面试中经常碰到类似问题,问题的关键我觉得是用设置一个缓冲区 还有一个思路 是通过Linux split 命令将文件直接切割成小文件,再进行处理再汇总。 或者jdk7提供的 forkjoin 框架,利用forkjoinpool管理的线程池,处理此种问题,未尝试过。 以下内容转自: http://blo ...
分类:
编程语言 时间:
2018-02-03 16:12:53
阅读次数:
344