码迷,mamicode.com
首页 >  
搜索关键字:样本    ( 4292个结果
KNN分类算法--python实现
一、kNN算法分析 K最近邻(k-Nearest Neighbor,KNN)分类算法可以说是最简单的机器学习算法了。它采用测量不同特征值之间的距离方法进行分类。它的思想很简单:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 ...
分类:编程语言   时间:2014-12-15 23:30:03    阅读次数:605
R语言与数据分析之五:主成分分析
主成份分析历史: Pearson于1901年提出,再由Hotelling(1933)加以发展的一种多变量统计方法。通过析取主成分显出最大的个别差异,也用来削减回归分析和聚类分析中变量的数目,可以使用样本协方差矩阵或相关系数矩阵作为出发点进行分析。 通过对原始变量进行线性组合,得到优化的指标:把原先多个指标的计算降维为少量几个经过优化指标的计算(占去绝大部分份额) 基本思想:设法将原先众多具有...
分类:编程语言   时间:2014-12-15 10:29:54    阅读次数:290
机器学习方法概述
KNN k临近算法遍历所有训练样本,求距离最近的点的结论,作为最后的预测结果MR版:map求样本距离(key:样本,value:距离),combine求的最小值,是过滤功能,reduce就有一个求得距离最小值贝叶斯:贝叶斯定理公式:P(A|B)=P(B|A)*P(A)/P(B)贝叶斯将在属性条件下的...
分类:其他好文   时间:2014-12-15 10:21:20    阅读次数:121
deep learning 学习(二)线性回归的matalab操作
继续学习http://www.cnblogs.com/tornadomeet/archive/2013/03/15/2961660.html题目是:50个数据样本点,其中x为这50个小朋友到的年龄,年龄为2岁到8岁,年龄可有小数形式呈现。Y为这50个小朋友对应的身高,当然也是小数形式表示的。现在的问...
分类:其他好文   时间:2014-12-14 22:26:34    阅读次数:310
机器学习经典算法详解及Python实现---朴素贝叶斯分类及其在文本分类、垃圾邮件检测中的应用
朴素贝叶斯分类是贝叶斯分类器的一种,贝叶斯分类算法是统计学的一种分类方法,利用概率统计知识进行分类,其分类原理就是利用贝叶斯公式根据某对象的先验概率计算出其后验概率(即该对象属于某一类的概率),然后选择具有最大后验概率的类作为该对象所属的类。总的来说:当样本特征个数较多或者特征之间相关性较大时,朴素贝叶斯分类效率比不上决策树模型;当各特征相关性较小时,朴素贝叶斯分类性能最为良好。另外朴素贝叶斯的计算过程类条件概率等计算彼此是独立的,因此特别适于分布式计算。本文详述了朴素贝叶斯分类的统计学原理,并在文本分类中...
分类:编程语言   时间:2014-12-12 20:56:48    阅读次数:1004
fold change(ratio)
fold change英文简称 : FC中文全称 : 倍性变化所属分类 : 生物科学词条简介 : 一种用于描述两个用于相比的对象数量差异的方法。例如,第一个样本和第二个样本的量是50/10,那么FC(Ratio)就是5,反之就是0.2。用这种方法分析微阵列的数据可以说明:1)从基因表达的绝对值而来的...
分类:其他好文   时间:2014-12-12 11:29:31    阅读次数:153
【机器学习基础】理解为什么机器可以学习2——Hoeffding不等式
PAC可学习性很大程度上由所需的训练样本数量决定。随着问题规模的增长所带来的所需训练样本的增长称为学习问题的样本复杂度(sample complexity)。在多数实际问题中,最限制学习器成功的因素是有限的可用的训练数据。...
分类:其他好文   时间:2014-12-11 20:54:21    阅读次数:245
理解随机森林
理解随机森林 随机森林利用随机的方式将许多决策树组合成一个森林,每个决策树在分类的时候投票决定测试样本的最终类别。下面我们再详细说一下随机森林是如何构建的。 随机森林主要包括4个部分:随机选择样本;随机选择特征;构建决策树;随机森林投票分类。...
分类:其他好文   时间:2014-12-11 14:11:30    阅读次数:235
Matlab三种归一化方法
归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1--+1之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论是为了建模还是为了计算,首先基本度量单位要同一,神经网络是以样本在事件中的统计分别几率来进行训练(概率计算)和预测的,且sigmoid函数的取值是0到1之间的,网络最后一个节点的输出也是如此,所以经常要对样本的输出归一化处理。归一化是统一在0...
分类:其他好文   时间:2014-12-10 10:47:08    阅读次数:547
Notes of Daily Scrum Meeting(12.8)
今日团队任务总结:团队成员今日团队工作陈少杰使用例子对json数据进行解析王迪确定搜索功能的接口金鑫对布局文件进行协助修改雷元勇开始进行搜索功能的代码实现高孟烨按照学长的样本对课程列表界面进行重新设计李承晗学会使用get和post方法发送信息郑培蕾写团队博客,督促队员学习,协调进度燃尽图:
分类:其他好文   时间:2014-12-10 00:21:29    阅读次数:224
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!