这是一篇Python爬取CSDN下载资源信息的例子,主要是通过urllib2获取CSDN某个人所有资源的资源URL、资源名称、下载次数、分数等信息;写这篇文章的原因是我想获取自己的资源所有的评论信息,但是由于评论采用JS临时加载,所以这篇文章先简单介绍如何人工分析HTML页面爬取信息。...
分类:
编程语言 时间:
2015-07-21 18:46:39
阅读次数:
117
1.原理:
这个程序可以实现批量获取到某一个CSDN博客的个人信息、目录与链接的对应,并存到一个本目录的mulu.txt文件中
2.具体代码:
# -*- coding: cp936 -*-
import urllib.request#
import re#
import sys#
import time#
import random
import string
headers = {#...
分类:
编程语言 时间:
2015-05-19 10:44:32
阅读次数:
156