码迷,mamicode.com
首页 > 其他好文 > 详细

MapReduce——并行期望最大值化算法(EM在高斯混合分布中的应用)

时间:2014-06-11 00:33:52      阅读:418      评论:0      收藏:0      [点我收藏+]

标签:机器学习   模式识别   并行期望最大值   mapreduce   分布式   

首先给出期望最大值化算法在高斯混合分布中的应用,我们用《Pattern Recognition and Machine Learning》中第九章中的符号:

假设有bubuko.com,布布扣个观测数据组成的集合bubuko.com,布布扣bubuko.com,布布扣个高斯分布,

E步:

bubuko.com,布布扣bubuko.com,布布扣bubuko.com,布布扣

M 步:

bubuko.com,布布扣

bubuko.com,布布扣

bubuko.com,布布扣

bubuko.com,布布扣bubuko.com,布布扣

—————————————————————————————————————————————————————

并行的期望最大值化算法:

假设有bubuko.com,布布扣个观测数据组成 的集合bubuko.com,布布扣bubuko.com,布布扣个高斯分布,首先把这bubuko.com,布布扣个观测数据,分成bubuko.com,布布扣份(可以是不等分也可以是等分),假设这bubuko.com,布布扣个子集,分别有

bubuko.com,布布扣个观测数据,其中bubuko.com,布布扣,然后,把这bubuko.com,布布扣个子集,分别分布到bubuko.com,布布扣Mapper上,则:


E步:

第一个Mapper,就算关于第一个子集的

bubuko.com,布布扣bubuko.com,布布扣bubuko.com,布布扣

并同时计算:

bubuko.com,布布扣bubuko.com,布布扣

第二个Mapper,就算关于第二个子集的


bubuko.com,布布扣bubuko.com,布布扣bubuko.com,布布扣

并同时计算:

bubuko.com,布布扣bubuko.com,布布扣

以此类推:

在每一个Mapper上做类似的计算


bubuko.com,布布扣Mapper,就算关于第bubuko.com,布布扣个子集的

bubuko.com,布布扣bubuko.com,布布扣,bubuko.com,布布扣

并同时计算:

bubuko.com,布布扣bubuko.com,布布扣

M步:

Reducer中,通过在Mapper中,求出的值,可以计算:

bubuko.com,布布扣,

bubuko.com,布布扣

bubuko.com,布布扣bubuko.com,布布扣

然后把得到的bubuko.com,布布扣,bubuko.com,布布扣,广播到每一个Mapper中,然后,

在第一台Mapper中,计算

bubuko.com,布布扣

在第二台Mapper中,计算

bubuko.com,布布扣

以此类推:


在第M台Mapper中,计算

bubuko.com,布布扣

然后在Reducer中,可以计算:

bubuko.com,布布扣,bubuko.com,布布扣


MapReduce——并行期望最大值化算法(EM在高斯混合分布中的应用),布布扣,bubuko.com

MapReduce——并行期望最大值化算法(EM在高斯混合分布中的应用)

标签:机器学习   模式识别   并行期望最大值   mapreduce   分布式   

原文地址:http://blog.csdn.net/zhangping1987/article/details/29360785

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!