包括Python,eclipse,jdk,pydev,pip,setuptools,beautifulsoup,pyyaml,nltk,mysqldb的下载安装配置。*************************************************python下载:python-2....
分类:
编程语言 时间:
2015-02-26 18:08:07
阅读次数:
183
#---------------------------------import---------------------------------------
#coding:utf-8
import urllib2;
from BeautifulSoup import BeautifulSoup;
#-----------------------------------------------...
分类:
编程语言 时间:
2015-02-21 09:46:47
阅读次数:
256
年前有个坑爹的需求来了,要把某点评网商户数据都给获取下来存储于数据库,好啦其实这个东西是蛮简单的;首先到点评网把城市数据给拷贝下来,当然你也可以写个脚本把数据抓取下来,不够我没这么干;好了下面是用于抓取数据的脚本,下面我分享下给大家:城市列表:alashan|57|阿拉善anshan|58|鞍山an...
分类:
其他好文 时间:
2015-02-16 00:21:42
阅读次数:
880
# -*- coding=utf-8 -*-
import urllib2
from BeautifulSoup import BeautifulSoup as bs3
import json
import codecs
#字符检测,用来检测其真实的编码格式
import chardet
#save content to file
def save_to_file(filename, co...
分类:
Web程序 时间:
2015-02-14 23:51:34
阅读次数:
333
以汽车之家为例子,抓取页面并进行解析
# -*- coding=utf-8 -*-
import urllib2
from BeautifulSoup import BeautifulSoup as bs3
import json
import codecs
#字符检测,用来检测其真实的编码格式
import chardet
#save content to file
def save_...
分类:
其他好文 时间:
2015-02-14 17:35:13
阅读次数:
178
1.给自己一个强烈的目标(爬虫)2.大致了解这个目标如何实现3.安装环境(2.7.6)4.学习python基本概念和语法(3c学院)5.找一个该目标的类似的demo,跑起来玩一玩6.为了跑起来demo需要安装一些库(requests,bs4,html2text)7.为了装置库方便,找自动化的方法(p...
分类:
编程语言 时间:
2015-02-14 09:47:41
阅读次数:
190
最先想试试python的爬虫功能,于是用easy_install安装了beautifulsoup,下面是我写的demo代码,可以简单看看
#coding=utf-8
import urllib2
from BeautifulSoup import BeautifulSoup as bs
url_addr = 'http://car.autohome.com.cn/baoyang/detail...
分类:
编程语言 时间:
2015-02-12 18:28:39
阅读次数:
208
HTTP定义了一种在服务器和客户端之间传递数据的途径。URL定义了一种唯一标示资源在网络中位置的途径。REQUESTS 和 RESPONSES:客户端先建立一个TCP连接,然后发送一个请求。服务器受到请求处理后发送一个响应向客户端传递数据。然后客户端可以继续发送请求或者关闭这个TCP连接。HTTPS...
分类:
移动开发 时间:
2015-02-12 12:00:59
阅读次数:
227
2月有两场比赛,总分前八的有纪念品。第一场排第11,要拿到奖品毫无把握。。心血来潮写了个用来计算几场比赛总分排名的脚本,好让自己第一时间知道能不能得奖(囧),也稍微试下BeautifulSoup。# -*- coding: utf-8 -*-from bs4 import BeautifulSoup...
分类:
编程语言 时间:
2015-02-11 00:28:19
阅读次数:
211
功力不是体现在独具匠心的构造
而是体现在对几个对象的熟练处理,"得心应手"不过如此了。
def getinfo( tp=('1000000', '888810'), queue=queue ):
username, password = tp
try:
s = requests.Session()
r = s.post( "http://iho...
分类:
编程语言 时间:
2015-02-09 00:52:16
阅读次数:
234