标签:
题目:
解题思路:
题目里已经说的很清楚了,字符可能在网页的源代码里。右键查看网页源代码,发现其中有一段:find rare characters in the mess below。有些人是直接把下面这长长一段复制下来,然后进行处理。我觉得吧,这法子实在有些简单粗暴…我的解决方法是先用urllib2抓取网页,然后通过正则表达式获取文本并进行处理。
实现方法:
import urllib2 import re req = urllib2.urlopen(‘http://www.pythonchallenge.com/pc/def/ocr.html‘) res = req.read() mess = ‘‘.join(re.findall(‘-->(.*)-->‘,res,re.S)) chars = ‘‘.join(re.findall(r‘[a-z]|[A-Z]|[0-9]‘,mess)) print chars
方法解释:
输出:
equality
将url里的ocr替换成equality进入下一关。
标签:
原文地址:http://www.cnblogs.com/glorywu/p/PythonChallenge-2.html