之前一直用R,现在开始学python之后就来尝试用Python来实现Kmeans。 之前用R来实现kmeans的博客:笔记︱多种常见聚类模型以及分群质量评估(聚类注意事项、使用技巧) 聚类分析在客户细分中极为重要。有三类比较常见的聚类模型,K-mean聚类、层次(系统)聚类、最大期望EM算法。在聚类 ...
分类:
编程语言 时间:
2018-05-08 14:36:58
阅读次数:
1835
本文主要介绍隐马尔可夫模型以及该模型中的三大问题的解决方法。 隐马尔可夫模型的是处理序列问题的统计学模型,描述的过程为:由隐马尔科夫链随机生成不可观测的状态随机序列,然后各个状态分别生成一个观测,从而产生观测随机序列。 在这个过程中,不可观测的序列称为状态序列(state sequence), 由此 ...
分类:
其他好文 时间:
2018-05-02 15:56:07
阅读次数:
293
一、前述 Em算法是解决数学公式的一个算法,是一种无监督的学习。 EM算法是一种解决存在隐含变量优化问题的有效方法。EM算法是期望极大(Expectation Maximization)算法的简称,EM算法是一种迭代型的算法,在每一次的迭代过程中,主要分为两步:即求期望(Expectation)步骤 ...
分类:
编程语言 时间:
2018-04-09 13:18:53
阅读次数:
149
利用隐含变量最佳类别(EM算法思想)实现将数据更加准确地聚类 ...
分类:
编程语言 时间:
2018-04-06 20:21:26
阅读次数:
191
EM算法 极大似然估计(MLE) 最大后验概率(MAP) https://blog.csdn.net/shenxiaoming77/article/details/51643845 https://blog.csdn.net/zk_j1994/article/details/53997787 htt ...
分类:
其他好文 时间:
2018-03-23 21:15:01
阅读次数:
189
基本概念 1Markov Models 2Hidden Markov Models 3概率计算算法前向后向算法 1-3-1直接计算 1-3-2前向算法 1-3-3后向算法 4学习问题Baum-Welch算法也就是EM算法 5预測算法 基本概念 1.1Markov Models 处理顺序数据的最简单的 ...
分类:
其他好文 时间:
2018-02-13 19:00:22
阅读次数:
212
1.前言 对大量需要分类的文本数据进行标记是一项繁琐、耗时的任务,而真实世界中,如互联网上存在大量的未标注的数据,获取这些是容易和廉价的。在下面的内容中,我们介绍使用半监督学习和EM算法,充分结合大量未标记的样本,以期获得文本分类更高的准确率。本文使用的是多项式朴素贝叶斯作为分类器,通过EM算法进行 ...
分类:
编程语言 时间:
2018-02-07 14:55:24
阅读次数:
251
用EM算法估计GMM模型参数 参考 西瓜书 再看下算法流程 ...
分类:
编程语言 时间:
2018-01-26 22:42:42
阅读次数:
156
下面主要介绍EM的整个推导过程。 回顾优化理论中的一些概念。设f是定义域为实数的函数,如果对于所有的实数x,,那么f是凸函数。当x是向量时,如果其hessian矩阵H是半正定的(),那么f是凸函数。如果或者,那么称f是严格凸函数。 Jensen不等式表述如下: 如果f是凸函数,X是随机变量,那么 特 ...
分类:
编程语言 时间:
2018-01-25 23:11:29
阅读次数:
204
参考 从最大似然到 EM 算法浅解 最大似然估计学习总结 EM 算法及其推广学习笔记 之前已经总结了似然的概念,那么顺其自然的理解就是,求得似然最大值的参数即为想要的参数,也就是参数估计,使用的方法为最大似然估计。 先提出几个问题: 1.最大似然估计求参数的一般流程是怎样的? 2.什么样的场景适合/ ...
分类:
其他好文 时间:
2018-01-22 11:59:05
阅读次数:
204