作者:十岁的小男孩 凡心所向,素履可往 目录 监督学习—混淆矩阵 是什么?有什么用?怎么用? 非监督学习—匹配矩阵 混淆矩阵 矩阵每一列代表预测值,每一行代表的是实际的类别。这个名字来源于它可以非常容易的表明多个类别是否有混淆(也就是一个class被预测成另一个class)。 假设有一个用来对猫(c ...
分类:
其他好文 时间:
2018-08-09 18:31:08
阅读次数:
379
一、聚类 聚类分析是非监督学习的很重要的领域。所谓非监督学习,就是数据是没有类别标记的,算法要从对原始数据的探索中提取出一定的规律。而聚类分析就是试图将数据集中的样本划分为若干个不相交的子集,每个子集称为一个“簇”。它的难点是不好调参和评估。下面是sklearn中对各种聚类算法的比较。 二、K-Me ...
分类:
编程语言 时间:
2018-07-21 11:47:37
阅读次数:
262
一、机器学习分类: 1、监督学习: 是指我们给算法一个数据集,并且给定正确答案, 2、非监督学习: ...
分类:
其他好文 时间:
2018-07-20 22:32:31
阅读次数:
150
机器学习类型 机器学习模型评估步骤 深度学习数据准备 特征工程 过拟合 解决机器学习问题的一般性流程 机器学习四分支 二分类、多分类以及回归问题都属于监督学习--目标是学习训练输入和对应标签之间的关系。 监督学习只是机器学习的冰山一角。机器学习主要分为4类:监督学习、非监督学习、半监督学习和强化学习 ...
分类:
编程语言 时间:
2018-07-18 23:33:11
阅读次数:
218
@(131 Machine Learning | 机器学习) PCA是一种特征选择方法,可将一组相关变量转变成一组基础正交变量 25 PCA的回顾和定义 Demo: when to use PCA 1. latent features driving the patterns in the data ...
分类:
其他好文 时间:
2018-07-18 20:28:28
阅读次数:
146
异常点检测,有时也叫离群点检测,英文一般叫做Novelty Detection或者Outlier Detection,是比较常见的一类非监督学习算法,这里就对异常点检测算法做一个总结。 1. 异常点检测算法使用场景 什么时候我们需要异常点检测算法呢?常见的有三种情况。一是在做特征工程的时候需要对异常 ...
分类:
编程语言 时间:
2018-07-15 21:16:11
阅读次数:
315
(1)涉及到的算法 1.监督学习:线性回归,逻辑回归,神经网络,SVM。 线性回归(下面第三行x0(i)其实是1,可以去掉) 逻辑回归 神经网络(写出前向传播即可,反向框架会自动计算) SVM 2.非监督学习:聚类算法(K-mean),降维(PCA) K-mean PCA 3.异常检测 4.推荐系统 ...
分类:
其他好文 时间:
2018-07-07 20:23:41
阅读次数:
177
一、K-means 非监督学习中有一大类问题是聚类问题,其中有个经典算法:K-means,其中K代表我们事先已经知道要将数据集分成K类 。K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。 原理如下图 ...
分类:
其他好文 时间:
2018-06-28 15:57:30
阅读次数:
237
1 Why? Reason1 Knowledge Discovery (about human beings limitaitons) Reason2 Cause of Dimensionality (维度灾难) (about ML algorithm itself) 所需的数据量会根据你所拥有的特 ...
分类:
其他好文 时间:
2018-06-24 13:00:23
阅读次数:
212
在机器学习中,监督学习和非监督学习算法是非常重要的,但是二者应该如何区分开来呢? 要向对二者进行区分,首先就要对训练的数据进行检查,看一下训练数据中是否有标签,这是二者最根本的区别。监督学习的数据既有特征又有标签,而非监督学习的数据中只有特征而没有标签。 监督学习是通过训练让机器自己找到特征和标签之 ...
分类:
其他好文 时间:
2018-06-22 13:29:11
阅读次数:
219