标签:lin 模型 targe cos 移动 save ref ase 改变
本文我们讨论期望最大化理论,应用和评估基于期望最大化的聚类。
我们将使用mclust软件包附带的“糖尿病”数据。
期望最大化(EM)算法是用于找到最大似然的或在统计模型参数,其中该模型依赖于未观察到的潜变量最大后验(MAP)估计的迭代方法。期望最大化(EM)可能是无监督学习最常用的算法。
似然函数找到给定数据的最佳模型。
假设我们翻转硬币并得到以下内容 - 0,1,1,0,0,1,1,0,0,1。我们可以选择伯努利分布
或者,如果我们有以厘米为单位的人的身高(男性和女性)的数据。高度遵循正常的分布,但男性(平均)比女性高,因此这表明两个高斯分布的混合模型。
以糖尿病数据为例
BIC值用于选择簇的数量
聚类图
分类不确定性的图表
簇的轨道图
大数据部落 -中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务
统计分析和数据挖掘咨询服务:y0.cn/teradat(咨询服务请联系官网客服)
【服务场景】
科研项目; 公司项目外包;线上线下一对一培训;数据采集;学术研究;报告撰写;市场调查。
【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询
标签:lin 模型 targe cos 移动 save ref ase 改变
原文地址:https://www.cnblogs.com/tecdat/p/11254459.html