信息检索(IR)的评价指标介绍 - 准确率、召回率、F1、mAP、ROC、AUC 分类:
1.自然语言处理/机器学习 2011-07-06 22:15 9817人阅读 评论(7) 收藏
举报performance算法fp工具2010c在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评...
分类:
其他好文 时间:
2014-05-15 17:01:10
阅读次数:
382
Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括:一个强大的N维数组对象Array;比较成熟的(广播)函数库;用于整合C/C++和Fortran代码的工具包;实用的线性代数、傅里叶变换和随机数生成函数。
SciPy是....
分类:
编程语言 时间:
2014-05-15 14:06:15
阅读次数:
505
本文根据Daphne Koller的课程整理。
PDM(ProbabilisticGraphiccal Models)
称为概率图模型。下面分别说明3个词对应的意义。
概率
-给出了不确定性的明确量度。
-给出了根据不确定性进行推断的有力工具。
-利用数据结构,建立了进行学习的方法,解决十分大规模的问题。
图
这里主要用到2种概率图,用于表示依赖关系。如图1所示...
分类:
其他好文 时间:
2014-05-15 13:00:48
阅读次数:
295
主要内容来自stanford Andrew Ng视频课程的总结。讲的很好,还有对应的习题,课程可以在下面网站搜索到。
https://www.coursera.org/
机器学习的目的是在训练数据的基础上得出一个模型,该模型对于给定的输入x,给出相应的输出y。用公式表示就是:y = h(x)。注意x表示一维向量,x={x1,x2,x3...}。这里的xi也就是特征(featur...
分类:
其他好文 时间:
2014-05-15 08:20:58
阅读次数:
366
k-近邻算法原理:存在一个样本的数据集合,也叫训练的样本集,样本集中每个数据都有标签,算法分类时,输入没有分类的新数据,将新数据的每个特征与样本集中每个数据对应的特征进行比较,然后样本集可以计算得到与新数据的相似度,然后取前k(通常不大于20)大相似度所对应的类标签,然后将新数据标识为k个中类标签最...
分类:
其他好文 时间:
2014-05-15 07:42:07
阅读次数:
401
稍后补上Restricted Boltzmann Machines的东西,其实Boltzmann Machines搞懂了,Restricted Boltzmann Machines很简单的,就是加了几个限制条件而已。
计划再写一篇将DBN的,感觉只要Boltzmann Machines搞懂了,其他的都不是什么难题。...
分类:
其他好文 时间:
2014-05-14 15:04:53
阅读次数:
239
必须先搞清楚机器学习中两个很重要的概念,一个是监督学习(Supervised
Learning)和无监督学习(Unsupervised Learning)。
这两者的区别就是前者知道了结果的正确值,后者没有这个指导值,也就是说你不知道所谓的正确结果。 wikipedia上这样描述: 监督学习从给定的...
分类:
其他好文 时间:
2014-05-13 21:59:39
阅读次数:
334
机器学习和计算机视觉都是很多种数学的交汇场。看着不同的理论体系的交汇,对于一个researcher来说,往往是非常exciting的enjoyable的事情。不过,这也代表着要充分了解这个领域并且取得有意义的进展是很艰苦的。Linear
Algebra (线性代数) 和 Statistics (统计...
分类:
其他好文 时间:
2014-05-12 01:19:12
阅读次数:
400
紧锣密鼓的项目又开始了,经过一番研究准备融合神经网络与增强学习来实现基于FPGA的XX路径规划,越来越觉得这里边需要学的东西太多了,特别是机器学习好深邃啊。之前要在FPGA上实现的BP神经网络准备换成CMAC神经网络了,一开始以为CMAC神经网络挺容易,后来才发现理解起来也不是那么简单,而且与具体应用联系起来时实现起来还是问题重重,主要是在高维输入环境下权值的存取如何来解决,看了Jar-Shone...
分类:
其他好文 时间:
2014-05-11 13:18:17
阅读次数:
248
一、核函数的引入
问题1:
SVM显然是线性分类器,但数据如果根本就线性不可分怎么办?
解决方案1:
数据在原始空间(称为输入空间)线性不可分,但是映射到高维空间(称为特征空间)后很可能就线性可分了。
问题2:
映射到高维空间同时带来一个问题:在高维空间上求解一个带约束的优化问题显然比在低维空间上计算量要大得多,这就是所谓的“维数灾难”。
解决方案2:
于是就引入了“核...
分类:
其他好文 时间:
2014-05-11 04:12:21
阅读次数:
443