网易公开课,第9课
notes,http://cs229.stanford.edu/notes/cs229-notes4.pdf 这章要讨论的问题是,如何去评价和选择学习算法
Bias/variance tradeoff 还是用这组图,学习算法追求的是generalization error(对未知...
分类:
其他好文 时间:
2014-06-11 12:21:15
阅读次数:
445
这部分介绍 sampling 方法,书上也称为 particle-based
method,这是因为每一个从分布中采集到的样本可以看成是一个 particle(instantiation of r.v.),而我们的 inference
借助了 particles。比较简单的问题就是 forward ...
分类:
其他好文 时间:
2014-06-08 22:50:20
阅读次数:
355
C++矩阵处理工具——Eigen最近和一些朋友讨论到了C++中数学工具的问题,以前总是很2地自己写矩阵运算,或者有时候在matlab里计算了一些数据再往C程序里倒,唉~想想那些年,我们白写的代码啊……人家早已封装好了!首先推荐几个可以在C++中调用的数学平台:eigen、bias、lapack、sv...
分类:
其他好文 时间:
2014-05-30 21:34:32
阅读次数:
291
Apache DataFu分两部分,本文介绍的是其Pig UDF的部分。代码在Github上开源。
DataFu里面是一些Pig的UDF,主要包括这些方面的函数:
bags、geo、hash、linkanalysis、random、sampling、sessions、sets、stats、urls
每方面都对应一个package。
我把所有的函数源码都浏览了一遍。其实本身对这些UDF的使用,官方的文档上都有介绍,而且源码的注释里也些的很清晰。所以使用本身是很简单的。
从实现角度看,继承自Pig Ev...
分类:
其他好文 时间:
2014-05-09 01:14:25
阅读次数:
436
简单的以下面曲线拟合例子来讲:直线拟合后,相比原来的点偏差最大,最后一个图完全拟合了数据点偏差最小;但是拿第一个直线模型去预测未知数据,可能会相比最后一个模型更准确,因为最后一个模型过拟合了,即第一个模型的方差比最后一个模型小。一般而言高偏差意味着欠拟合,高方差意味着过拟合。他们之间有如下的关系:
...
分类:
其他好文 时间:
2014-05-07 00:28:40
阅读次数:
946
费老劲看了parameter estimation for text
analysis,这两天一定把这个gibbs sampling for the
uninitiated看完><先收两个看起来不错的笔记:http://www.crescentmoon.info/?p=504http://www.x...
分类:
其他好文 时间:
2014-04-29 22:07:06
阅读次数:
467
发现自己不写总结真是件很恶劣的事情,好多学的东西没有自己总结都忘记了。所以决定从今天开始,学东西的时候一定跟上总结。我写的东西大多数是自己通俗的总结,不太喜欢写严格的定义或者证明,写了也记不住,欢迎指正。1.
High Bias vs. High Variance High Bias:通常是因为模....
分类:
其他好文 时间:
2014-04-28 12:59:34
阅读次数:
607