首页 > 编程语言 > 详细

无监督算法

时间：2019-02-02 14:23:14 阅读：164 评论：0 收藏：0 [点我收藏+]

标签：聚类距离制造业 png 天气常见 family 欺诈个数

无监督算法：

KMeans算法：

1、随机初始化数据集簇的中心，一般从数据集中选择

2、外循环：

内循环：计算各个数值点到中心的距离，进行聚类

计算每个聚类的平局值，移动聚类中心

技术图片

技术图片

PCA算法：

目标：数据压缩和可视化

1、对样本数据进行去均值和归一化

2、组建sigma矩阵，然后进行奇异值分解，求的压缩和的结果Z

技术图片

技术图片

异常检测算法：

1、选择可能适应于异常样本的特征

2、根据样本得到高斯分布的均值和方差

3、对给定的样本计算其是否为异常样本

技术图片

技术图片

异常检测与监督学习：

异常检测：正样本数量较少（0-20）；大量的负样本

不同类型的正样本，很难从正样本中学的算法将其识别出来

未来会出现之前从未出现过的正样本，与当前的正样本无相似性

监督学习：有大量的正样本和负样本；

足够的样本支撑可以从中学到正样本的特征的检测算法

未来很难出现正样本中未出现过的样本

技术图片

技术图片

常见的异常检测和监督学习：

异常检测：欺诈行为/制造业/数据中心的监测

监督学习：垃圾邮件/天气/癌症

技术图片

无监督算法

标签：聚类距离制造业 png 天气常见 family 欺诈个数

原文地址：https://www.cnblogs.com/abella/p/10348320.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！