天气预报首先需要的就是天气信息,可以从中国天气网的Wap网站上获取,因为Wap网站页面简单,便于抓取内容。网址是:http://wap.weather.com.cn/wap/,默认是北京的天气预报,可以更换城市。某城市的天气预报对应的网址是http://wap.weather.com.cn/wap/weather/city_code.shtml..
分类:
编程语言 时间:
2014-12-04 06:31:51
阅读次数:
297
k-means:基于划分算法的典型、实现比较简单。特点是只能聚球形、受离群点的影响很大。
采用python实现:用二维矩阵来存点集和质心点、每次循环分两步:计算质心和重新分配点,循环直到最小平方误差SSE收敛为止,或者指定一个最大的迭代次数。
关于画图,我使用的是pylab和Matplotlib,Matplotlib中的很多函数和matlab用法一样,比较方便作图,安装它时花了很长的时间来解决...
分类:
其他好文 时间:
2014-12-03 15:43:56
阅读次数:
230
支持向量机基本上是最好的有监督学习算法,因其英文名为support vector machine,简称SVM。通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。 本文详述SVM的理论基础,并通过Python实现了该算法。...
分类:
编程语言 时间:
2014-12-01 14:20:05
阅读次数:
279
我们知道利用JSON模块可方便的将Python基本类型(dict、list等)数据永久的存储成文件,同时也可以通过自定义转换函数和继承JSON encode&decode的方法实现自定义类的存储。本文就在前文“ Python JSON模块”的基础上,实现python支持JSON存储的对象。
对象能够采取JSON存储和解析是有很大意义的。例如机器学习中所有分类算法的训练过程中都存在大量的数据计算,如果每次启动分类都需要重新训练分类算法浪费资源且没有效率,如果能够将训练产生的分类算法对象保存起来,那么除非需要...
分类:
编程语言 时间:
2014-11-28 14:27:15
阅读次数:
276
K-means聚类算法算法优缺点:优点:容易实现缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢使用数据类型:数值型数据算法思想k-means算法实际上就是通过计算不同样本间的距离来判断他们的相近关系的,相近的就会放到同一个类别中去。1.首先我们需要选择一个k值,也就是我们希望把数据分成多少类,...
分类:
编程语言 时间:
2014-11-28 06:13:30
阅读次数:
368
环境:win7-64位VS2013python-2.7.8-32位(得用32位,这很重要)boost.python-1.57步骤:一.“安装”boost.python解压boost.python后,用VS的[本机命令提示工具](开始-VS2013-VSTools)进入到boost的文件夹,运行bootstrap.bat生成bjam.exe。然后运行:bjam--with-pythonlin..
分类:
编程语言 时间:
2014-11-27 18:44:21
阅读次数:
245
上周写完了该代码,但是由于没有注意到softmax相关的实现故结果不对,更正后可以得到正确结果,用200幅图片训练200次可以得到90%以上的正确率,参数设置还有待于优化,另外可以考虑用多线程加速,此处目前还有问题(有待于修改,慎用)。推导请参考之前的文章http://blog.csdn.net/xuanyuansen/article/details/41214115。...
分类:
编程语言 时间:
2014-11-27 12:42:24
阅读次数:
323
trie,又称前缀树或字典树. 它利用字符串的公共前缀来节约存储空间.
定义
Trie树中每个单词都是通过character by character方法进行存储,相同前缀单词共享前缀节点.
可以看到,每条路径组成一个单词.上面这颗树存了to/tea/ted/ten/inn这些词.
性质
(1)根节点不包含字符,除根节点外的每个节点只包含一个字符。(2)从根节点到...
分类:
编程语言 时间:
2014-11-24 17:20:14
阅读次数:
219
Logistic回归算法优缺点:1.计算代价不高,易于理解和实现2.容易欠拟合,分类精度可能不高3.适用数据类型:数值型和标称型算法思想:其实就我的理解来说,logistic回归实际上就是加了个sigmoid函数的线性回归,这个sigmoid函数的好处就在于,将结果归到了0到1这个区间里面了,并且s...
分类:
编程语言 时间:
2014-11-24 00:49:02
阅读次数:
575