码迷,mamicode.com
首页 > 其他好文 > 详细

碎碎念 - 异常点检测

时间:2014-12-08 15:08:31      阅读:200      评论:0      收藏:0      [点我收藏+]

标签:使用   问题   as   方法   需要   异常   注意   标准   awk   

异常点的定义参考hawkings离群点定义。需要注意的问题有属性个数、全局/局部、异常程度、一次识别异常个数、评估等。检测方法有:基于模型的方法、基于邻近度的方法、基于密度的方法。在基于模型的方法下,对一元正态分布使用标准差区分;对多元正态分布使用mahalanobis距离区分,它会考虑分布的形状;对屏蔽(masking)问题,使用混合模型进行最大似然度估计。在基于邻近度的方法下,近邻数k越大,越有可能检测为异常点。在基于密度的方法下,密度可以通过逆距离和点计数计算;当簇的密度不均时,使用相对密度。

碎碎念 - 异常点检测

标签:使用   问题   as   方法   需要   异常   注意   标准   awk   

原文地址:http://www.cnblogs.com/xbwz/p/4151092.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!