相比kNN的无脑比较相似度,我们需要一种能够较清晰地给出数据内在含义的分类器。 这一章给出了“决策树”这种选择,这一概念本身不难理解,问题在于 在树的每一层如何划分数据集能达到最好的效果 (书中选用的是ID3算法,虽然不是很理解这个名字,但算法本身不是很难理解) 这里的效果,我们引入信息熵这个概念进 ...
分类:
其他好文 时间:
2017-03-04 21:08:52
阅读次数:
150
今天我想送给大家两句话:1:在这个浮躁的社会中,每个人都想找到捷径,那么我想认真踏实地做好一件事也便是最大的捷径了。2:不要管别人做什么,有自己的目标,可能你现在的环境牛人多多,让你压力巨大,也可能你身处的环境废物多多,让你感慨你本可以让自己更加强大。不要管这些,只要相信自己选择的,走下去。 以上献 ...
分类:
其他好文 时间:
2017-03-01 21:20:06
阅读次数:
209
笔者最近开始对机器学习非常感兴趣,作为一个有志向的软设方向的女孩纸,我开始了学习的第一步入门,下面将今天刚刚学习的kNN及其应用进行总结和回顾,希望可以得到更好的提升,当然,有志同道合者,你可以联系我给我留言,毕竟菜鸟一起飞才能飞的更高更远。😳 首先,kNN算法也叫k-近邻算法,它的工作原理是:存 ...
分类:
其他好文 时间:
2017-02-18 21:17:31
阅读次数:
231
k-近邻算法算是一个非常暴力也非常好理解的算法 (抽象来讲,就是和谁长得像就分为哪一类 如何划分长得像还是不像的尺度? 把特征值当做坐标,把个体当做线性空间中的离散点,取k个离目标最近的训练集点,进行label vote,少数服从多数。 That's it. 至于什么是label vote...完全 ...
分类:
编程语言 时间:
2017-02-14 17:42:09
阅读次数:
171
最近翻Peter Harrington的《机器学习实战》,看到Logistic回归那一章有点小的疑问。 作者在简单介绍Logistic回归的原理后,立即给出了梯度上升算法的code:从算法到代码跳跃的幅度有点大,作者本人也说了,这里略去了一个简单的数学推导。 那么其实这个过程在Andrew Ng的机 ...
分类:
系统相关 时间:
2017-02-14 00:58:06
阅读次数:
355
声明:文章是读书笔记,所以必然有大部分内容出自《机器学习实战》。外加个人的理解,另外修改了部分代码,并添加了注释1、什么是K-近邻算法?简单地说,k-近邻算法采用测量不同特征值之间距离的方法进行分类。...
分类:
编程语言 时间:
2017-02-06 11:18:38
阅读次数:
834
看完一节《机器学习实战》,算是踏入ML的大门了吧!这里就详细讲一下一个demo:使用kNN算法实现手写字体的简单识别 kNN 先简单介绍一下kNN,就是所谓的K-近邻算法: 【作用原理】:存在一个样本数据集合、每个样本数据都存在标签。输入没有标签的新数据后,将新数据的每个特征与样本集数据的对应特征进 ...
分类:
其他好文 时间:
2017-01-31 00:33:23
阅读次数:
400
1 #encoding:utf-8 2 from numpy import * 3 import feedparser 4 5 #加载数据集 6 def loadDataSet(): 7 postingList = [['my', 'dog', 'has', 'flea', 'problems', ... ...
分类:
其他好文 时间:
2017-01-07 19:37:40
阅读次数:
421
tree.py代码 treePlotter.py代码 ...
分类:
其他好文 时间:
2017-01-07 00:34:10
阅读次数:
307
1 #encoding:utf-8 2 from numpy import * 3 import operator 4 import matplotlib 5 import matplotlib.pyplot as plt 6 7 from os import listdir 8 9 def mak... ...
分类:
编程语言 时间:
2017-01-06 13:47:57
阅读次数:
245