1背景介绍现今分布式计算框架像MapReduce和Dryad都提供了高层次的原语,使用户不用操心任务分发和错误容忍,非常容易地编写出并行计算程序。然而这些框架都缺乏对分布式内存的抽象和支持,使其在某些应用场景下不够高效和强大。RDD(Resilient Distributed Datasets弹性分布式数据集)模型的产生动机主要来源于两种主流的应用场景:Ø 迭代式算法:迭代式机器学习、图算法,包...
分类:
其他好文 时间:
2014-11-22 16:08:17
阅读次数:
392
本文对于高斯混合模型(GMM)进行了简要的讨论。对于单高斯模型,高斯混合模型以及K-means等都进行了简要的介绍以及其关系的梳理,着重介绍了高斯混合模型的参数估计问题,这包括在样本分类已知情况下的MLE算法估计,以及在样本分类未知情况下的EM算法估计。...
分类:
其他好文 时间:
2014-11-22 16:07:13
阅读次数:
339
局部加权紧接着上面的线性回归中参数求解来继续讲吧。还是以上面的房屋价格的预测,它的中心思想是在对参数进行求解的过程中,每个样本对当前参数值的影响是有不一样的权重的。比如上节中我们的回归方程为(这个地方用矩阵的方法来表示?表示参数,i表示第i个样本,h为在?参数下的预测值):我们的目标是让最小,然后求...
分类:
其他好文 时间:
2014-11-21 20:30:20
阅读次数:
278
逻辑回归(Logistic Regression)是机器学习中十分常用的一种模型,属于广义线性模型。在互联网领域得到了广泛的应用,尤其是在广告系统中用来估计CTR。本文主要介绍逻辑回归的模型形式,求解策略和算法。接着介绍逻辑回归的最大似然估计,最后说明为什么逻辑回归要采用sigmoid函数做变换。模...
分类:
其他好文 时间:
2014-11-21 18:26:10
阅读次数:
360
最近在看机器学习,看能否根据已有的历史来预测Hardware的故障发生概率。下文是一篇很有意思的文章,转自http://numenta.org/htm.html。NuPIC是一个开源项目,用来实现HTM.-------------------There are many things humans ...
分类:
Web程序 时间:
2014-11-21 14:07:40
阅读次数:
217
From:http://www.cnblogs.com/tornadomeet/p/3395593.html 前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话....
分类:
编程语言 时间:
2014-11-20 21:56:14
阅读次数:
343
From:http://blog.jobbole.com/60809/在理解了我们需要解决的机器学习问题之后,我们可以思考一下我们需要收集什么数据以及我们可以用什么算法。本文我们会过一遍最流行的机器学习算法,大致了解哪些方法可用,很有帮助。机器学习领域有很多算法,然后每种算法又有很多延伸,所以对于一...
分类:
编程语言 时间:
2014-11-20 21:51:06
阅读次数:
262
From:http://blog.jobbole.com/53546/很多人觉得机器学习高不可攀,认为这是一门只有少数专业学者才了解的神秘技术。毕竟,你是在让运行在二进制世界里的机器得出它自己对现实世界的认识。你正在教它们如何思考。然而,本文几乎不是你所认为的晦涩难懂、复杂而充满数学公式的文章。正如...
分类:
其他好文 时间:
2014-11-20 21:47:54
阅读次数:
214
From:http://blog.jobbole.com/58937/事实上有许多的途径可以了解机器学习,也有许多的资源例如书籍、公开课等可为所用,一些相关的比赛和工具也是你了解这个领域的好帮手。本文我将围绕这个话题,给出一些总结性的认识,并为你由程序员到机器学习高手的蜕变旅程中提供一些学习指引。机...
分类:
其他好文 时间:
2014-11-20 21:39:46
阅读次数:
251