在机器学习领域,混淆矩阵(confusion matrix),又称为可能性表格或是错误矩阵。它是一种特定的矩阵用来呈现算法性能的可视化效果,通常是监督学习(非监督学习,通常用匹配矩阵:matching matrix)。其每一列代表预测值,每一行代表的是实际的类别。这个名字来源于它可以非常容易的表明多个类别是否有混淆(也就是一个class被预测成另一个class)。...
分类:
其他好文 时间:
2015-04-07 23:29:49
阅读次数:
642
有了数据,剩下的就是流水线上的活:利用某种机器学习算法学习得到模型,在用模型进行预测,评价模型的性能。1 分割训练集和测试集Python的机器学习包sklearn非常强大,它不仅包含了不论监督学习、非监督学习的算法,同时包括了进行常用预处理和其他流程的函数。分割训练集和测试集的函数虽然很简单,但也包...
分类:
其他好文 时间:
2015-03-04 22:37:23
阅读次数:
837
前言 在前面的文章中,涉及到的机器学习算法均为监督学习算法。 所谓监督学习,就是有训练过程的学习。再确切点,就是有 "分类标签集" 的学习。 现在开始,将进入到非监督学习领域。从经典的聚类问题展开讨论。所谓聚类,就是事先并不知道具体分类方案的分类 (允许知道分类个数)。 本文将介绍一个最为经...
分类:
编程语言 时间:
2015-01-06 17:06:13
阅读次数:
499
1、分类:具有类别标签,将数据集根据分到相应的类别 聚类:没有类别标签,将数据集根据他们的相似度分为不同的簇2、监督学习:用于学习的数据集都是输入\输出数据对,学习的任务是找到输入与输出的对应规则 非监督学习:用于学习的数据集只有输入,学习的任务是对于数据进行分析,找到输出3、分类与回归: 分...
分类:
其他好文 时间:
2014-12-24 06:24:16
阅读次数:
110
监督学习(supervised learning):叫监督学习的原因是因为我们告诉了算法,我们想要预测什么。所谓监督,其实就是我们的意愿是否能直接作用于预测结果。典型代表:分类(classification)和回归(regression)。非监督学习(unsupervised learning):在...
分类:
其他好文 时间:
2014-12-21 00:39:40
阅读次数:
232
PCA是一种非监督学习算法,它能够在保留大多数有用信息的情况下,有效降低数据纬度。它主要应用在以下三个方面:1. 提升算法速度2. 压缩数据,减小内存、硬盘空间的消耗3. 图示化数据,将高纬数据映射到2维或3维总而言之,PCA干的事情就是完成一个将原始的n维数据转化到k维的映射。其中,k<n它的核心...
分类:
编程语言 时间:
2014-12-10 17:44:02
阅读次数:
256
统计学习是基于数据构建统计模型从而对数据进行预测与分析,统计学习由监督学习,非监督学习,半监督学习和强化学习等组成
统计学习由模型的假设空间(学习的模型属于某个函数的集合),模型选择的准则,及模型学习的算法
分类:
其他好文 时间:
2014-11-29 21:31:23
阅读次数:
173
在机器学习范畴,根据反馈的不同,学习技术可以分为监督学习(Supervised learning)、非监督学习(Unsupervised learning)和强化学习(Reinforcement learning)三大类。其中强化学习是一种以环境反馈作为输入的、特殊的、适应环境的机器学习方法。所谓强...
分类:
其他好文 时间:
2014-11-27 18:06:35
阅读次数:
168
这篇文章浅谈一下我对机器学习中生成模型和判别模型的认识。首先,机器学习算法分为监督学习、半监督学习、非监督学习等。而对于监督学习,又可以分成生成学习(generative approach)和判别学习(discriminative approach)。下面是NG对这两个概念的解释:Algorithm...
分类:
其他好文 时间:
2014-11-23 22:57:44
阅读次数:
218
这篇博客对应的是Andrew.Ng的那篇文章:An Analysis o f Single-Layer Networks in Unsupervised Feature Learning,文章的主要目的是讨论receptive field size,number of hidden nodes, s...
分类:
其他好文 时间:
2014-11-19 20:03:54
阅读次数:
255