一个队列至少满足2个方法,put和get.
借助最小堆来实现.
#coding=utf-8
from heapq import heappush, heappop
class PriorityQueue:
def __init__(self):
self._queue = []
def put(self, item, priority):
he...
分类:
编程语言 时间:
2014-10-14 15:05:08
阅读次数:
193
采用了多线程和锁机制,实现了广度优先算法的网页爬虫。对于一个网络爬虫,如果要按广度遍历的方式下载,它就是这样干活的: 1.从给定的入口网址把第一个网页下载下来 2.从第一个网页中提取出所有新的网页地址,放入下载列表中 3.按下载列表中的地址,下载所有新的网页 4.从所有新的网页中找出没有下载过的网页...
分类:
编程语言 时间:
2014-10-13 22:44:27
阅读次数:
248
工作中需要判断某个文本中的URL是否能正常访问,并且随机获取其中N行能正常访问的URL数据,我的思路是:读取文本每一行数据,用urlopen访问,将返回状态码为200的URL保存到一个列表,获得列表长度,使用random产生一个随机值作为列表下标,获取该行数据。具体实现如下: 1 import ur...
分类:
编程语言 时间:
2014-10-13 17:10:39
阅读次数:
233
实例一:利用SMTP与EMAIL实现邮件发送,带附件(完整代码)__author__ = 'Administrator'#coding=gb2312from email.Header import Headerfrom email.MIMEText import MIMETextfrom email...
分类:
编程语言 时间:
2014-10-11 21:37:26
阅读次数:
217
学习了下python,看了一个简单的网页爬虫:http://www.cnblogs.com/fnng/p/3576154.html自己实现了一个简单的网页爬虫,获取豆瓣的最新电影信息。爬虫主要是获取页面,然后对页面进行解析,解析出自己所需要的信息进行进一步分析和挖掘。首先需要学习python的正则表...
分类:
编程语言 时间:
2014-10-11 20:13:06
阅读次数:
260
前段时间写的pubwin会员合并程序文字版本的请查看http://www.cnblogs.com/sprite/p/3477734.html#-*-coding:gbk-*-# pubwin member repare tools# change member level by score# cod...
分类:
编程语言 时间:
2014-10-11 17:17:35
阅读次数:
258
说明:程序使用http://s.tool.chinaz.com/same此网站查询的结果,使用python简单的实现抓取结果
先随便查询一个结果,抓包分析,如图:
使用python模仿post表单,使用正则表达式匹配结果
代码如下:
# -*- coding: utf-8 -*-
import urllib
import urllib2
import re
import ...
分类:
编程语言 时间:
2014-10-11 04:15:34
阅读次数:
249
朴素贝叶斯python实现 ,实例学习朴素贝叶斯分类方法。...
分类:
编程语言 时间:
2014-10-11 00:29:04
阅读次数:
628
网上介绍K-近邻算法的例子很多,其Python实现版本基本都是来自于机器学习的入门书籍《机器学习实战》,虽然K-近邻算法本身很简单,但很多初学者对其Python版本的源代码理解不够,所以本文将对其源代码进行分析。
什么是K-近邻算法?
简单的说,K-近邻算法采用不同特征值之间的距离方法进行分类。所以它是一个分类算法。
优点:无数据输入假定,对异常值不敏感
缺点:复杂度高
...
分类:
编程语言 时间:
2014-10-10 23:56:14
阅读次数:
326
一直想用隐马可夫模型做图像识别,但是python的scikit-learn组件包的hmm module已经不再支持了,需要安装hmmlearn的组件,不过hmmlearn的多项式hmm每次出来的结果都不一样,= =||,难道是我用错了??后来又只能去参考网上C语言的组件,模仿着把向前向后算法“...
分类:
编程语言 时间:
2014-10-09 01:54:57
阅读次数:
557