K-means算法 在聚类问题中,给定数据集{x(1), . . . , x(m)},想要把这些数据划分成几个紧密联系的簇(clusters)。通常情况下,这里的x(i)∈ Rn,而标签y(i)是未知的。因此这是一个非监督式学习(unsupervised learning)问题。 最简单的聚类算法是 ...
分类:
编程语言 时间:
2018-11-04 19:43:29
阅读次数:
254
本次实战项目是关于航空公司客户价值的分析,其中用到的聚类方法是K-Means方法,属于非监督学习。 Tools :python 3.6; jupyter os : mac os reference: 数据分析与挖掘实战,csdn 数据分析或挖掘涉及的一般步骤: 数据集中共有62988个客户的基本信息 ...
分类:
其他好文 时间:
2018-11-03 18:17:21
阅读次数:
485
聚类——无监督学习的一种算法 K-means算法 最为广泛使用的聚类算法 选择两个聚类中心 簇分配:根据每个样本更接近哪个聚类中心进行样本的分配 簇中心移动:计算出所有的红点类的均值点,移动原始聚类中心到这个点,蓝点类同理 进行不断地迭代直到收敛 输入:K个簇类和训练集样本数据 注意:不需要X0项, ...
分类:
系统相关 时间:
2018-10-30 13:52:09
阅读次数:
292
机器学习的定义: 让机器代替人,实现人的工作。 现有的机器学习分类: (1)监督学习 > 分类问题 (2)半监督学习 > 聚类问题 (3)非监督学习 > 聚类问题 (4)强化学习 > 降维 归纳: 主要可分为:分类、回归/预测、聚类和维度下降。 机器学习“六步走”: a.收集数据; b.准备数据 c ...
分类:
其他好文 时间:
2018-09-25 17:26:11
阅读次数:
175
1. 聚类分析 聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术 >> 将观测对象的群体按照相似性和相异性进行不同群组的划分,划分后每个群组内部各对象相似度很高,而不同群组之间的对象彼此相异度很高。 *** 回归、分类、聚类的区别 : ...
分类:
其他好文 时间:
2018-09-20 01:13:09
阅读次数:
280
作者:十岁的小男孩 凡心所向,素履可往 目录 监督学习—混淆矩阵 是什么?有什么用?怎么用? 非监督学习—匹配矩阵 混淆矩阵 矩阵每一列代表预测值,每一行代表的是实际的类别。这个名字来源于它可以非常容易的表明多个类别是否有混淆(也就是一个class被预测成另一个class)。 假设有一个用来对猫(c ...
分类:
其他好文 时间:
2018-08-09 18:31:08
阅读次数:
379
一、聚类 聚类分析是非监督学习的很重要的领域。所谓非监督学习,就是数据是没有类别标记的,算法要从对原始数据的探索中提取出一定的规律。而聚类分析就是试图将数据集中的样本划分为若干个不相交的子集,每个子集称为一个“簇”。它的难点是不好调参和评估。下面是sklearn中对各种聚类算法的比较。 二、K-Me ...
分类:
编程语言 时间:
2018-07-21 11:47:37
阅读次数:
262
一、机器学习分类: 1、监督学习: 是指我们给算法一个数据集,并且给定正确答案, 2、非监督学习: ...
分类:
其他好文 时间:
2018-07-20 22:32:31
阅读次数:
150
机器学习类型 机器学习模型评估步骤 深度学习数据准备 特征工程 过拟合 解决机器学习问题的一般性流程 机器学习四分支 二分类、多分类以及回归问题都属于监督学习--目标是学习训练输入和对应标签之间的关系。 监督学习只是机器学习的冰山一角。机器学习主要分为4类:监督学习、非监督学习、半监督学习和强化学习 ...
分类:
编程语言 时间:
2018-07-18 23:33:11
阅读次数:
218
@(131 Machine Learning | 机器学习) PCA是一种特征选择方法,可将一组相关变量转变成一组基础正交变量 25 PCA的回顾和定义 Demo: when to use PCA 1. latent features driving the patterns in the data ...
分类:
其他好文 时间:
2018-07-18 20:28:28
阅读次数:
146