码迷,mamicode.com
首页 >  
搜索关键字:urllib    ( 2222个结果
Python 实现的下载op海贼王网的图片(网络爬虫)
没得事就爬一下我喜欢的海贼王上的图片 需要在d盘下建立一个imgcache文件夹 # -*- coding: utf-8 -*- import urllib import urllib2 import json from bs4 import BeautifulSoup import threadpool import thread class htmlpaser: de...
分类:编程语言   时间:2014-06-29 07:15:05    阅读次数:304
python爬虫之采集360搜索的联想词
有个视频专门讲过这个爬虫,但是太罗嗦了,顺便整理下,而且到现在,360也不傻,已经进化了,采用原来的方式,多少有点bug,这个后面会说。正题如下: 语言:python2.7.6 模块:urllib,urllib2,re,time 目标:输入任意词,抓到其联想词 版本:w1 原理:在360搜索主页:http://www.so.com/,当你输入”科技“时,搜索框会列出相应的联想词或者短...
分类:编程语言   时间:2014-06-14 09:11:06    阅读次数:1111
python实现图片爬虫
#encoding:utf-8 import sys reload(sys) sys.setdefaultencoding('utf8') from sgmllib import SGMLParser import re import urllib class URLLister(SGMLParser): def start_a(self, attrs): url = [v ...
分类:编程语言   时间:2014-05-25 22:47:56    阅读次数:340
python3简单爬虫
最近在抽空学了一下python,于量就拿爬是练了下手,不得不说python的上手非常简单。在网上找了一下,大都是python2的帖子,于是随手写了个python3的。代码非常简单就不解释了,直接贴代码。#test rdpimport urllib.requestimport re#登录用的帐户信息d...
分类:编程语言   时间:2014-05-25 22:07:34    阅读次数:449
python实现人人网留言获取与一键删除
最近有点着迷Python,学习基本语法之后,首先从爬虫开始,看了《使用python登录人人网并发表状态》一文后,很感兴趣,然后又曾经苦于人人网聊天记录删除的繁琐,于是决定写一个聊天记录一键删除的小脚本,好啦,废话不多说:#encoding:utf-8import urllib2, urllib, c...
分类:编程语言   时间:2014-05-24 09:35:03    阅读次数:390
python爬虫问题请教一下大家(急等回复)
我在编写一段pythn爬虫的时候遇到一个估计是编码的问题,可以怎么也解决不好。代码如下:#- * - coding: UTF-8 -*-import urllib.requestimport rehtml = urllib.request.urlopen("http://weibo.com/p/10...
分类:编程语言   时间:2014-05-22 00:59:35    阅读次数:354
Python爬虫示例
1 #!/usr/bin/python 2 #coding:utf8 3 import re 4 import urllib 5 6 def gethtml(url): 7 page=urllib.urlopen(url) 8 html=page.read() 9 ret...
分类:编程语言   时间:2014-05-10 18:39:47    阅读次数:399
python内置的urllib模块不支持https协议的解决办法
Django站点使用django_cas接入SSO(单点登录系统),配置完成后登录,抛出“urlopen error unknown url type: https”异常。寻根朔源发现是python内置的urllib模块不支持https协议。 >>> import urllib >>> urllib.urlopen('http://www.baidu.com') > >>> url...
分类:编程语言   时间:2014-05-07 03:43:55    阅读次数:424
2222条   上一页 1 ... 220 221 222 223 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!