KNN(K Nearest Neighbor) 还是先记几个关键公式 距离:一般用Euclidean distance E(x,y)√∑(xi-yi)2 。名字这么高大上,就是初中学的两点间的距离嘛。 还有其他距离的衡量公式,余弦值(cos),相关度(correlation) 曼哈顿距离(manha ...
分类:
编程语言 时间:
2018-08-22 18:29:40
阅读次数:
207
这两天翻了一下机器学习实战这本书,算法是不错,只是代码不够友好,作者是个搞算法的,这点从代码上就能看出来。可是有些地方使用numpy搞数组,搞矩阵,总是感觉怪怪的,一个是需要使用三方包numpy,虽然这个包基本可以说必备了,可是对于一些新手,连pip都用不好,装的numpy也是各种问题,所以说能不用 ...
分类:
编程语言 时间:
2018-08-20 00:29:33
阅读次数:
215
一、基础理解 Hard Margin SVM 和 Soft Margin SVM 都是解决线性分类问题,无论是线性可分的问题,还是线性不可分的问题; 和 kNN 算法一样,使用 SVM 算法前,要对数据做标准化处理; 原因:SVM 算法中设计到计算 Margin 距离,如果数据点在不同的维度上的量纲 ...
分类:
其他好文 时间:
2018-08-12 21:30:47
阅读次数:
7404
测试集+训练集数据地址:https://i.cnblogs.com/Files.aspx knn.rar ...
分类:
编程语言 时间:
2018-08-11 17:46:46
阅读次数:
223
from numpy import * import operator def createDataSet(): group = array([[3,104],[2,100],[1,81],[101,10],[99,5],[98,2]]) labels = ['爱情片','爱情片','爱情片','动... ...
分类:
编程语言 时间:
2018-08-10 21:18:29
阅读次数:
154
带GUI界面的,基于python sklearn knn算法的手写数字识别器,可用于识别手写数字,训练数据集为mnist。 ...
分类:
编程语言 时间:
2018-08-10 10:48:45
阅读次数:
240
k近邻算法(knn)是一种基本的分类与回归的算法,k means是一种基本的聚类方法。 k近邻算法(knn) 基本思路:如果一个样本在特征空间的k个最相似(即特征空间最邻近)的样本大多数属于某一类,则该样本也属于这一类。 影响因素: 1. k值的选择。k的值小,则近似误差小,估计误差大;k的值大,则 ...
分类:
编程语言 时间:
2018-08-10 10:47:02
阅读次数:
147
在机器学习这个领域,尤其是做多媒体(声音、图像、视频)相关的机器学习方法研究,会涉及很多特征、分类模型(分类任务)的选择。以声音识别为例,常见的特征有MFCC、LPCC、spectrogram-likefeatures等,分类模型就很多了,有传统的分类模型SVM、KNN、RandomForest,还有现在比较火的深度模型DNN、CNN、RNN等。而往往单特征、单模型很难取得理想的性能(perfor
分类:
其他好文 时间:
2018-08-09 15:40:32
阅读次数:
281
1、c4.5 c4.5算法是机器学习算法中的一种分类决策树算法,其核心是ID3算法,c4.5算法继承了ID3算法的优点,并在一下几个放米娜对ID3算法进行了改进: 1)用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足。 2)在树构造过程中进行剪枝。 3)能够完成对不连续属 ...
分类:
编程语言 时间:
2018-08-07 22:23:00
阅读次数:
152
一、KNN概述 K-(最)近邻算法KNN(k-Nearest Neighbor)是数据挖掘分类技术中最简单的方法之一。它具有精度高、对异常值不敏感的优点,适合用来处理离散的数值型数据,但是它具有 非常高的计算复杂度和空间复杂度,需要大量的计算(距离计算)。 它的工作原理是:如果已经给定一个带有标签( ...
分类:
编程语言 时间:
2018-08-06 15:23:38
阅读次数:
212