随机梯度上升法--一次仅用一个样本点来更新回归系数(因为可以在新样本到来时对分类器进行增量式更新,因而属于在线学习算法)梯度上升法在每次更新回归系统时都需要遍历整个数据集,该方法在处理100个左右的数据集时尚可,但如果有数十亿样本和成千上万的特征,那么该方法的计算复杂度太高了。随机梯度上升算法伪代码...
分类:
其他好文 时间:
2015-01-20 20:05:00
阅读次数:
265
International Conference on Machine Learninghttp://icml.cc/2015/ICML is the leading international machine learning conference and is supported by theI...
分类:
其他好文 时间:
2015-01-20 17:44:38
阅读次数:
228
原文:http://developer.51cto.com/art/201501/464174.htm编者按:本文收集了百来篇关于机器学习和深度学习的资料,含各种文档,视频,源码等。而且原文也会不定期的更新,望看到文章的朋友能够学到更多。《Brief History of Machine Learn...
分类:
其他好文 时间:
2015-01-20 17:12:20
阅读次数:
744
【转载】李航博士的《浅谈我对机器学习的理解》 机器学习与自然语言处理
分类:
编程语言 时间:
2015-01-20 13:31:45
阅读次数:
240
σ代数
令X是一个样本空间(sample space)Ω的所有子集(subsets)的集合的一个子集,那么集合X被称为σ代数(σ-algebra)又叫σ域(σ-field)。
它有以下几个性质:
(1)Φ∈X;(Φ为空集)
(2)若A∈X,则A的补集A^c∈X;
(3)若Ai∈X(i=1,2,…)则∪Ai∈X;
可测空间
Ω是任意集合,而X是把Ω中的极端情况去...
分类:
其他好文 时间:
2015-01-20 12:04:24
阅读次数:
143
不会输,超碉!井字棋这个游戏真是太无聊啦!算法大概就是,有一个给状况进行估价的函数,深搜每种状况,假设每个人都按对自己最有利的方式走(假设玩家也是不傻),最后让电脑走出最有利的一步。代码: 1 //#pragma comment(linker, "/STACK:102400000,10240000....
分类:
编程语言 时间:
2015-01-20 06:11:29
阅读次数:
557
交叉验证是一种模型选择方法,其将样本的一部分用于训练,另一部分用于验证。因此不仅考虑了训练误差,同时也考虑了泛化误差。从这里可以看出机器学习、数据挖掘与传统统计学的一个重要差别:传统统计学更注重理论,追求理论的完整性和模型的精确性,在对样本建立某个特定模型后,用理论去对模型进行各种验证;而机器学习/数据挖掘则注重经验,如交叉验证,就是通过不同模型在同一样本上的误差表现好坏,来选择适合这一样本的模型,而不去纠结理论上是否严谨。...
分类:
其他好文 时间:
2015-01-19 11:02:31
阅读次数:
237