机器学习实战python因为图像处理的原因,初步学习机器学习,选用语言python,参考书籍《机器学习实战》环境:python3.4+ windows7 +64位系统首先,今天解决的是安装numpy1)安装python,这个比较简单,去官网下载个安装包就可以了,地址:https://www.pyth...
分类:
编程语言 时间:
2014-10-29 18:36:02
阅读次数:
235
机器学习实战中也详细描述了梯度上升算法,附件里是一些笔记,再贴一个还不错的帖子转http://blog.csdn.net/wyb_009/article/details/9205151这个算法搞得 我晚上十点打电话给弟弟,问Ln(x),1/x的导数公式。很惭愧,大学时被我用的出神入化、化成灰我都能认...
分类:
编程语言 时间:
2014-10-24 10:24:57
阅读次数:
894
1、k-近邻算法算法原理:存在一个样本数据集(训练样本集),并且我们知道样本集中的每个数据与其所属分类的对应关系。输入未知类别的数据后将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似(最近邻)的k组数据。然后将k组数据中出现次数最多的分类,来作为新数据的分类。算法步...
分类:
其他好文 时间:
2014-10-12 20:39:28
阅读次数:
199
网上介绍K-近邻算法的例子很多,其Python实现版本基本都是来自于机器学习的入门书籍《机器学习实战》,虽然K-近邻算法本身很简单,但很多初学者对其Python版本的源代码理解不够,所以本文将对其源代码进行分析。
什么是K-近邻算法?
简单的说,K-近邻算法采用不同特征值之间的距离方法进行分类。所以它是一个分类算法。
优点:无数据输入假定,对异常值不敏感
缺点:复杂度高
...
分类:
编程语言 时间:
2014-10-10 23:56:14
阅读次数:
326
机器学习的入门书籍《机器学习实战》使用的语言是python。下面介绍利用Python开始“机器学习”的准备工作。(环境:CentOS 7)
1, 两个重要的包
NumPy 和 SciPy。(http://scipy.org/scipylib/download.html )主要是处理数值运算,矩阵操作等。
注:Sci是Science的缩写。
官网介绍了安装方法,可以手动安装,也可以使...
分类:
编程语言 时间:
2014-10-10 18:20:44
阅读次数:
232
老规矩,Talk is cheap, show me your code.#-*-coding:utf-8-*-from math import logdef calcShannonEnt(datsSet): #长度 numEntries = len(dataSet) #字典统计 ...
分类:
其他好文 时间:
2014-10-04 14:58:46
阅读次数:
218
目的:利用kNN识别数字0-9材料:32*32的数字方阵(保存形式是文本文件)#-*-coding:utf-8-*-from numpy import *def img2vector(filename): #生成一个1*1024的array(zeros是numpy的函数,至于array与lis...
分类:
其他好文 时间:
2014-10-04 02:25:05
阅读次数:
234
《机器学习实战》终于到手了,开始学习了。由于本人python学的比较挫,所以学习笔记里会有许多python的内容。1、 python及其各种插件的安装 由于我使用了win8.1 64位系统(正版的哦),所以像numpy 和 matploblib这种常用的插件不太好装,解决方案就是Anaconda-....
分类:
其他好文 时间:
2014-09-29 16:02:01
阅读次数:
317
Apriori算法也属于无监督学习,它强调的是“从数据X中能够发现什么”。从大规模的数据集中寻找物品之间隐含关系被称为关联分析或者称为关联规则学习。这里的主要问题在于,寻找物品的不同组合是一项十分耗时的任务,所需的计算代价很高,蛮力搜索并不能解决这个问题。因此此处介绍使用Apriorio算法来解决上述问题。
1:简单概念描述
(1) 频繁项集:指经常出现在一块的物品的...
分类:
其他好文 时间:
2014-09-09 20:11:19
阅读次数:
313