标签:mpi code .com 字符 port 超链接 ignore for 多个
import re
import urllib.request
#(http://\S*?)[\"] 提取不带"
#http://\S*?[\"] 提取的时候带"
#\S非空字符 *0-多个 ?非贪婪 \"|>|)三个符号其中之一为结束
httpre=re.compile(r"(http://\S*?)[\"|>|)]",re.IGNORECASE)
for line in urllib.request.urlopen("http://www.baidu.com"):
line=line.decode("utf-8")
mylist = httpre.findall(line)
if mylist:
print(mylist)
标签:mpi code .com 字符 port 超链接 ignore for 多个
原文地址:http://www.cnblogs.com/888ewe/p/7802001.html