Classify handwritten digits using the famous MNIST data
This competition is the first in a series of tutorial competitions designed to introduce people to Machine Learning.
The goal in this comp...
分类:
其他好文 时间:
2015-01-16 13:07:42
阅读次数:
499
人工智能早已不是什么新鲜话题,但从2014年开始,人工智能离我们越来越近。2014年,微软小冰不断扩展互联网合作伙伴,试图尝试先在互联网领域发挥人工智能的市场价值;与此同时,国内百度等科技企业也在深度研发人工智能,无人驾驶等技术已有雏形,只是暂时未面向市场开放。不..
分类:
其他好文 时间:
2015-01-15 01:53:23
阅读次数:
154
求解最大似然估计时发现有两种表示方法
from:Gregor Heinrich - Parameter estimation for text analysis
from:http://blog.csdn.net/pipisorry/article/details/42649657
有上述两种方法表示的原因
p(x|theta)不总是代表条...
分类:
其他好文 时间:
2015-01-14 21:27:13
阅读次数:
213
开源机器学习工具scikit-learn入门。...
分类:
其他好文 时间:
2015-01-14 16:57:33
阅读次数:
162
LDA(Latent Dirichlet Allocation)主题模型是一种用统计进行文本挖掘的方法,它是pLSA(概率潜在语义分析)主题模型基础上加上贝叶斯框架而得到的模型。目前已应用于自然语言处理、计算机视觉、机器学习、信息检索等领域,得到了广泛关注。 LDA模型网上有多个开源代码,...
分类:
其他好文 时间:
2015-01-14 15:31:05
阅读次数:
308
我们的Hadoop生产环境有两个版本,其中一个是1.0.3,为了支持日志压缩和split,我们添加了hadoop-1.2中关于Bzip2压缩的feature. 一切运行良好。
为了满足公司对迭代计算的需求(复杂HiveSQL,广告推荐算法,机器学习 etc), 我们构建了自己的Spark集群,最初是Standalone Mode,版本spark-0.9.1,支持Shark。
上线后,问题接踵而...
分类:
编程语言 时间:
2015-01-14 11:10:35
阅读次数:
403
线性模型回顾
我们回顾一下之前的三种线性模型,它们的共同点是都要对输入的数据x做一个加权的分数s。
下图表示了这三种不同的线性模型的表示方式、误差函数和求解最小的Ein的方法。
这里可以看出,PLA算法这种线性分类模型,在求解Ein的时候是很困难的,相对而言,线性回归和logistic回归都有各自求解Ein的方法,那么我们能不能用这两种回归的计算方法来帮助...
分类:
其他好文 时间:
2015-01-13 21:34:53
阅读次数:
852
在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇,从这里开始,必须对机器学习了解才能进一步介绍EasyPR的内核。当然,本文也面对一般读者,不会对阅读有相关的前提要求。在进入正题前,我想...
分类:
其他好文 时间:
2015-01-13 12:16:28
阅读次数:
309
一. mahout简介:
Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现、分类、聚类等。Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能。
以下为在mahout实现的机器学习算法:
算法类...
分类:
其他好文 时间:
2015-01-13 00:09:27
阅读次数:
251
在最近学习模式识别和机器学习时经常会用到概率论的知识,索性重新复习一遍概率论的知识。学习概率论最重要的一点不是公式的记忆,而是对公式背后的含义的理解。(其实学习任何一门知识都是如此,但是相比高数等的抽象性来说,概率可能显得更“接地气”)
曾经在大学时代数学中学的最差的一门课便是概率论,然而最近的学习中,在几经挣扎之后却渐渐找到了这门课的乐趣,在本科时候学习的那个小小的课本将概率论的...
分类:
其他好文 时间:
2015-01-12 22:36:39
阅读次数:
241