标签:
5.14
...上次学python 好像是一个月前..
写点东西记录下叭..
现在在看李老大写的博客写..可能直接开抄代码...
感觉自己写的总是爬不成功,之前写的爬豆瓣影评的爬虫还是残的...
1.最简单的爬取一个网页
import urllib2
html = urllib2.urlopen(‘http://music.163.com/‘)
print html.read()
2.把爬取到的网页存起来
可是好像因为之前用了那个网页映射工具,现在生成 的 html 里面是当前目录下的东西,而不是自己爬的那个网页里面的内容...sigh..
import urllib2 response = urllib2.urlopen(‘http://music.163.com/‘) html = response.read() open(‘testt.html‘,"w").write(html)
标签:
原文地址:http://www.cnblogs.com/wuyuewoniu/p/5491979.html