标签:http os 使用 io ar 文件 数据 2014 art
本文所使用的验证码识别的方法非常暴力,高手可忽略。对于在客户端实现的“伪验证码”或使用静态图片的验证码,本文不作讨论。对于验证码的识别,一直以为,只要足够的样本,就可以分析出验证码的特征,从而进行分门别类,再通过和样本做比较,就可以得出正确验证码。这里简单而暴力的验证一下这个一直想验证而没有行动过的想法。做实验的网站是某体检机构,因为它生成的验证码很有规律(不确定是不是静态文件,但就可以当成是算法随机生成的),每个字符的位置相对固定,虽然每个字符的颜色和背景都不一样,但是背景颜色很相近,没有干扰线,更重要的是,它和中国很多很多网站的验证码很类似。相关代码和文件(某体检机构网站忽略):verification code identified。
暴力步骤:
85%左右的正确率,暴力破解其实也可以了,改进下有可能达到90%以上。验证码是网络的一道屏障,破解了验证码后,很多邪恶的事情都可以做。当然这里介绍的是最笨的方法,对于复杂的验证码还不能识别,还需要更复杂点的方法。本文仅是图片识别技术的讨论,相关的代码等仅用于学习,不得用于做非法事情。
POST AT: http://luoguochun.cn
标签:http os 使用 io ar 文件 数据 2014 art
原文地址:http://www.cnblogs.com/imlgc/p/3945937.html