机器学习中常常要用到分类算法,在诸多的分类算法中有一种算法名为k-近邻算法,也称为kNN算法。
一、kNN算法的工作原理
二、适用情况
三、算法实例及讲解
---1.收集数据
---2.准备数据
---3.设计算法分析数据
---4.测试算法
一、kNN算法的工作原理
官方解释:存在一个样本数据集,也称作训练样本集,并且样本中每个数据都存在标签,即我们知道样...
分类:
编程语言 时间:
2015-01-26 15:11:47
阅读次数:
304
机器学习中常常要用到分类算法,在诸多的分类算法中有一种算法名为k-近邻算法,也称为kNN算法。一、kNN算法的工作原理二、适用情况三、算法实例及讲解 ---1.收集数据 ---2.准备数据 ---3.设计算法分析数据 ---4.测试算法一、kNN算法的工作原理官方解释:存在一个样本数据集,也...
分类:
编程语言 时间:
2015-01-26 14:54:34
阅读次数:
267
1.定义:利用已有样本,产自拟合方程,从而对(未知数据)进行预测。2.用途:预测,合理性判断。3.分类:线性回归分析:一元线性回归,多元线性回归,广义线性(将非线性转化为线性回归,logic回归)非线性回归分析4.困难:变量选取,多重共线性,观察拟合方程,避免过度拟合5.关系:函数关系:确定性关系,...
分类:
其他好文 时间:
2015-01-25 15:02:58
阅读次数:
273
12.3.3.1 序列表达式中的平面映射
假设我们有一个关于城市的元组列表,每个元组包含城市的名字和它所在的国家,另外,我们还有一个列表,是用户所选的城市。因此,我们可以这样表示样本数据:
let cities = [ ("New York","USA"); ("London", "UK");
("Cambridge","UK"); ("Ca...
分类:
其他好文 时间:
2015-01-25 11:09:37
阅读次数:
182
一、问题描述线性回归问题非常简单。对于给定的m个样本 ,其中, 为第 i个样本的自变量,表示成n维列向量,即 (这里为了方便已经对 进行了增广,即对n-1维的变量增加取值为1的一维,组成n维,这样可以方便地将公式写成向量形式), 为对应的函数值。线性回归的目标是找到自变量和函数值直接的一个最佳线性拟...
分类:
其他好文 时间:
2015-01-23 19:52:07
阅读次数:
296
聚类分析:对样品或指标进行分类的一种分析方法,依据样本和指标已知特性进行分类。本节主要介绍层次聚类分析,一共包括3个部分,每个部分包括一个具体实战例子。1、常规聚类过程:一、首先用dist()函数计算变量间距离dist.r = dist(data, method=" ") 其中method包括6种方...
分类:
其他好文 时间:
2015-01-22 10:41:27
阅读次数:
1816
最近遇到数据预处理的一些问题,本来很简单的东西,但是却搞的烦烦的,痛定思痛,决定自己实现一下。
一、mapminmax
Process matrices by mapping row minimum and maximum values to [-1 1]
意思是将矩阵的每一行处理成[-1,1]区间,此时对于模式识别或者其他统计学来说,数据应该是每一列是一个样本,每一行是多个样本的同一维,即...
分类:
其他好文 时间:
2015-01-21 13:27:01
阅读次数:
416
介绍磁盘IO突然很高是运维人员经常碰到的问题,这是由于有大量的磁盘读和写造成的,通常发生在数据库身上,然而发生的场景各种各样。本文举几个例子阐述解决思路。正文找到是什么程序在大量的进行读写操作。可以通过监控软件(如zabbix)或工具(如atop)查看磁盘IO的历史记录..
分类:
其他好文 时间:
2015-01-21 06:43:41
阅读次数:
270
随机梯度上升法--一次仅用一个样本点来更新回归系数(因为可以在新样本到来时对分类器进行增量式更新,因而属于在线学习算法)梯度上升法在每次更新回归系统时都需要遍历整个数据集,该方法在处理100个左右的数据集时尚可,但如果有数十亿样本和成千上万的特征,那么该方法的计算复杂度太高了。随机梯度上升算法伪代码...
分类:
其他好文 时间:
2015-01-20 20:05:00
阅读次数:
265
理解皮尔逊相关的两个角度其一, 按照高中数学水平来理解, 皮尔逊相关(Pearson Correlation Coefficient)很简单, 可以看做将两组数据首先做Z分数处理之后, 然后两组数据的乘积和除以样本数Z分数一般代表正态分布中, 数据偏离中心点的距离.等于变量减掉平均数再除以标准差.(...
分类:
其他好文 时间:
2015-01-20 17:04:06
阅读次数:
228