标签:style blog http color for 2014 ar 问题
写在最前
最近做一个小玩意需要识别验证码,之前从来没接触过验证码识别这块,这可难到了我。所以,只有三番五次的麻烦度娘帮我找找验证码识别这块的资料。所幸,许多前辈分享的博文帮到了我。最终,完美的把问题解决。
我要识别的验证码属于非常简单的一种,如下图:
1、图片灰度化(把彩色的验证码图片转换成灰色图片)
for(int i = 0; i < bmp.Width; i++) { for(int j = 0; j < bmp.Height; j++) { Color color = bmp.GetPixel(i, j); int gray = (int)(color.R * 0.3 + color.G * 0.59 + color.B * 0.11); bmp.SetPixel(i, j, gray); } }
经过灰度化的图片就成了这个样子,如下图:
2、图片二值化(灰色图片转黑白图片)
for(int i = 0; i < bmp.Width; i++) { for(int j = 0; j < bmp.Height; j++) { int gray = (int)(bmp.GetPixel(i, j)); if (gray * 0.2125 + gray * 0.7154 + gray * 0.0721 >= v) //二值化,v为阈值,大于等于阈值的设为白色,否者设为黑色 { bmp.SetPixel(i, j, Color.FromArgb(255, 255, 255)); } else { bmp.SetPixel(i, j, Color.FromArgb(0, 0, 0)); } } }
经过二值化的图片就成了这个样子,如下图:
3、图片分割(把四个数字分割出来保存,作为模板)
把原来的整个验证码图片按照固定的宽、高分割出来(我是按左边距6像素,顶边距4像素,间隔4像素,宽9像素,高12像素分割)。然后取出各个数字图片的像素色,255输出1,其他输出0。就得到108(9*12)个0,1了。
111111111111111000000111100000000001001111111100011111111110001111111100100000000001111000000111111111111111
重复获取验证码,保存完所有数字(0-9)的0,1代码之后,以后就直接与这9串0,1模糊匹配(有杂色的可能,所以要模糊匹配),最后,拿这些模板比对就行了。
写在最后
对于获取模板还有很多其他方法(直接保存图片等 ),本次识别的验证码太简单,我用的保存字节代码的方法可行,换做复杂点的验证码可能就不行了。通过本次简单验证码识别还是收获不少东西的,今后还是有必要再多研究研究验证码识别这块。
标签:style blog http color for 2014 ar 问题
原文地址:http://www.cnblogs.com/wei-haijun/p/3903634.html