码迷,mamicode.com
首页 > 编程语言 > 详细

无监督算法

时间:2019-02-02 14:23:14      阅读:164      评论:0      收藏:0      [点我收藏+]

标签:聚类   距离   制造业   png   天气   常见   family   欺诈   个数   

无监督算法:

KMeans算法:

1、 随机初始化数据集簇的中心,一般从数据集中选择

2、 外循环:

内循环:计算各个数值点到中心的距离,进行聚类

        计算每个聚类的平局值,移动聚类中心

技术图片

 

 

技术图片

PCA算法:

目标:数据压缩和可视化

1、 对样本数据进行去均值和归一化

2、 组建sigma矩阵,然后进行奇异值分解,求的压缩和的结果Z

技术图片

 

技术图片

异常检测算法:

1、 选择可能适应于异常样本的特征

2、 根据样本得到高斯分布的均值和方差

3、 对给定的样本计算其是否为异常样本

 

技术图片

 

技术图片

异常检测与监督学习:

异常检测:正样本数量较少(0-20);大量的负样本

          不同类型的正样本,很难从正样本中学的算法将其识别出来

          未来会出现之前从未出现过的正样本,与当前的正样本无相似性

监督学习:有大量的正样本和负样本;

          足够的样本支撑可以从中学到正样本的特征的检测算法

          未来很难出现正样本中未出现过的样本

 

技术图片

 

技术图片

 

常见的异常检测和监督学习:

异常检测:欺诈行为/制造业/数据中心的监测

监督学习:垃圾邮件/天气/癌症

技术图片

无监督算法

标签:聚类   距离   制造业   png   天气   常见   family   欺诈   个数   

原文地址:https://www.cnblogs.com/abella/p/10348320.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!