---恢复内容开始---《 Machine Learning 机器学习实战》的确是一本学习python,掌握数据相关技能的,不可多得的好书!!最近邻算法源码如下,给有需要的入门者学习,大神请绕道。数字识别文件'''Created on Sep 16, 2010kNN: k Nearest Neigh...
分类:
编程语言 时间:
2015-04-16 12:13:25
阅读次数:
243
PCA 算法也叫主成分分析(principal components analysis),主要是用于数据降维的。为什么要进行数据降维?因为实际情况中我们的训练数据会存在特征过多或者是特征累赘的问题,比如:
一个关于汽车的样本数据,一个特征是”km/h的最大速度特征“,另一个是”英里每小时“的最大速度特征,很显然这两个特征具有很强的相关性
拿到一个样本,特征非常多,样本缺很少,这样的数据用回归去你和将...
分类:
编程语言 时间:
2015-04-15 23:27:39
阅读次数:
303
from numpy import *
# 创建一个实验样本
def loadDataSet():
postingList = [['my','dog','has','flea','problems','help','please'],
['maybe','not','take','him','to','dog','park','stupid'...
分类:
其他好文 时间:
2015-04-15 19:38:37
阅读次数:
160
介绍机器学习KNN算法,提供Matlab,Python实现以及实际应用例子...
分类:
编程语言 时间:
2015-04-14 14:41:04
阅读次数:
629
#-*-coding:utf-8-*-
import ch
ch.set_ch()
import matplotlib.pyplot as plt
decisionNode = dict(boxstyle = "sawtooth",fc="0.8")
leafNode = dict(boxstyle="round4",fc = "0.8")
arrow_args = dict(ar...
分类:
其他好文 时间:
2015-04-13 12:54:29
阅读次数:
312
简述算法上一章的kNN更像是应用统计知识来进行科学的预测,它可以完成许多分类任务。但是最大的缺点就是无法给出数据的内在含义,而决策树算法数据形式非常便于理解。决策树的结果经常会应用到专家系统当中。构建一棵决策树的流程:检测数据集中每一个子祥的属性是否属于同一类
if so return 类标签;
else
寻找划分数据集的最好特征
划分数据集...
分类:
其他好文 时间:
2015-04-13 09:47:03
阅读次数:
197
k临近算法(kNN)采用测量不同特征值之间的距离方法进行分类,也是一种非常直观的方法。本文主要记录了使用kNN算法改进约会网站的例子。任务一:分类算法classify0
就是使用距离公式计算特征值之间的距离,选择最邻近的k个点,通过统计这k个点的结果来得出样本的预测值。
tile函数用法在这里
argsort函数在这里def classify0(inX,dataset,labels,k):...
分类:
其他好文 时间:
2015-04-10 22:36:02
阅读次数:
233
from math import log
#以决策为标准计算信息熵
def calcShannonEnt(dataSet):
numEntries = len(dataSet)
labelCounts = {}
for featVec in dataSet:
currentLabel = featVec[-1]
if cu...
分类:
其他好文 时间:
2015-04-09 21:56:49
阅读次数:
265
这篇文章主要是结合机器学习实战将推荐算法和SVD进行相应的结合
任何一个矩阵都可以分解为SVD的形式
其实SVD意义就是利用特征空间的转换进行数据的映射,后面将专门介绍SVD的基础概念,先给出python,这里先给出一个简单的矩阵,表示用户和物品之间的关系
这里我自己有个疑惑?
对这样一个DATA = U(Z)Vt
这里的U和V真正的几何含义 : 书上的含义是U将物品映射到了新的特...
分类:
编程语言 时间:
2015-03-17 21:56:23
阅读次数:
276
最近因为论文原因在学习机器学习,看的一本叫做《机器学习实战》的书,看了看还是不错的,因为其中既有原理又有实例。今天载使用matplotlib进行画图时,发现中文会显示为小方块,这个问题真是神烦,折腾了一下午,终于搞定了,下面记录一下我解决的过程。 1. 查看matplotlib支持的中文字体 ...
分类:
系统相关 时间:
2015-03-17 20:02:35
阅读次数:
174