本文用讲一下指定分布的随机抽样方法:MC(Monte Carlo), MC(Markov Chain), MCMC(Markov Chain Monte Carlo)的基本原理,并用R语言实现了几个例子:
1. Markov Chain (马尔科夫链)
2. Random Walk(随机游走)
3. MCMC具体方法:
3.1 M-H法
3.2 Gibbs采样
PS:本篇blog为ese机器学习短期班参考资料(20140516课程)。...
分类:
其他好文 时间:
2014-05-15 23:58:14
阅读次数:
536
自从人工智能被提出之日起,已经过去了半个世纪,至今也没有达到人们期待的水准。也许,真正的人工智能永远也不会实现。
最近在研究图像检索时突然想到这个问题,在这里写下一些自己的思考。
人们最终所期望实现的人工智能应该是与人类具有一样的智慧或者超越人类的智慧,我们可以称之为智慧生命。但是智慧生命真的能够实现吗?
人工智能学科大致分为两派,一派是推理派,另一派是学习派。
推理派认为智慧生命应该像人...
分类:
其他好文 时间:
2014-05-15 23:07:10
阅读次数:
409
信息检索(IR)的评价指标介绍 - 准确率、召回率、F1、mAP、ROC、AUC 分类:
1.自然语言处理/机器学习 2011-07-06 22:15 9817人阅读 评论(7) 收藏
举报performance算法fp工具2010c在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评...
分类:
其他好文 时间:
2014-05-15 17:01:10
阅读次数:
382
Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括:一个强大的N维数组对象Array;比较成熟的(广播)函数库;用于整合C/C++和Fortran代码的工具包;实用的线性代数、傅里叶变换和随机数生成函数。
SciPy是....
分类:
编程语言 时间:
2014-05-15 14:06:15
阅读次数:
505
本文根据Daphne Koller的课程整理。
PDM(ProbabilisticGraphiccal Models)
称为概率图模型。下面分别说明3个词对应的意义。
概率
-给出了不确定性的明确量度。
-给出了根据不确定性进行推断的有力工具。
-利用数据结构,建立了进行学习的方法,解决十分大规模的问题。
图
这里主要用到2种概率图,用于表示依赖关系。如图1所示...
分类:
其他好文 时间:
2014-05-15 13:00:48
阅读次数:
295
主要内容来自stanford Andrew Ng视频课程的总结。讲的很好,还有对应的习题,课程可以在下面网站搜索到。
https://www.coursera.org/
机器学习的目的是在训练数据的基础上得出一个模型,该模型对于给定的输入x,给出相应的输出y。用公式表示就是:y = h(x)。注意x表示一维向量,x={x1,x2,x3...}。这里的xi也就是特征(featur...
分类:
其他好文 时间:
2014-05-15 08:20:58
阅读次数:
366
k-近邻算法原理:存在一个样本的数据集合,也叫训练的样本集,样本集中每个数据都有标签,算法分类时,输入没有分类的新数据,将新数据的每个特征与样本集中每个数据对应的特征进行比较,然后样本集可以计算得到与新数据的相似度,然后取前k(通常不大于20)大相似度所对应的类标签,然后将新数据标识为k个中类标签最...
分类:
其他好文 时间:
2014-05-15 07:42:07
阅读次数:
401
稍后补上Restricted Boltzmann Machines的东西,其实Boltzmann Machines搞懂了,Restricted Boltzmann Machines很简单的,就是加了几个限制条件而已。
计划再写一篇将DBN的,感觉只要Boltzmann Machines搞懂了,其他的都不是什么难题。...
分类:
其他好文 时间:
2014-05-14 15:04:53
阅读次数:
239
必须先搞清楚机器学习中两个很重要的概念,一个是监督学习(Supervised
Learning)和无监督学习(Unsupervised Learning)。
这两者的区别就是前者知道了结果的正确值,后者没有这个指导值,也就是说你不知道所谓的正确结果。 wikipedia上这样描述: 监督学习从给定的...
分类:
其他好文 时间:
2014-05-13 21:59:39
阅读次数:
334