http://cos.name/2013/01/lda-math-gamma-function/1. 神奇的Gamma函数1.1 Gamma 函数诞生记学高等数学的时候,我们都学习过如下一个长相有点奇特的Gamma函数Γ(x)=∫∞0tx?1e?tdt通过分部积分的方法,可以推导出这个函数有如下的递...
分类:
其他好文 时间:
2015-08-02 23:04:56
阅读次数:
194
4.6.1 The Stock Market Data> library (ISLR)> names(Smarket )[1] "Year" "Lag1" "Lag2" "Lag3" "Lag4"[6] "Lag5" "Volume " "Today" " Direction "> dim(Smar...
分类:
其他好文 时间:
2015-07-29 06:21:22
阅读次数:
440
1,线性判别分析(Linear Discriminant Analysis)(一)2,机器学习中的数学(4)-线性判别分析(LDA), 主成分分析(PCA)3,Machine Learning in Action – PCA和SVD
分类:
其他好文 时间:
2015-07-28 12:31:21
阅读次数:
122
机器学习中的数学(4)-线性判别分析(LDA), 主成分分析(PCA)版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com前言:第二篇的文...
分类:
其他好文 时间:
2015-07-21 21:56:35
阅读次数:
206
docs
setwd("E:/test/");
dirlist
voc
for(file in dirlist)
{
f
data
data
voc
voc
print(data)
df
print("---")
na
v
for(n in na)
{
v
}
m
l...
分类:
编程语言 时间:
2015-07-20 19:29:17
阅读次数:
323
用户身份 在1.0.4这个版本的Hadoop中,客户端用户身份是通过宿主操作系统给出。对类Unix系统来说, 用户名等于`whoami`; 组列表等于`bash -c groups`。 将来会增加其他的方式来确定用户身份(比如Kerberos、LDA...
分类:
其他好文 时间:
2015-07-16 20:13:09
阅读次数:
355
这段时间对LDA比较感兴趣,尝试在工作中使用它。平时做想法的快速验证,都用的是“GibbsLDA++-0.2”,一个c实现版本的LDA。这两天用c++ stl自己写了一个单机版的LDA,初衷如下:
1. “GibbsLDA++-0.2”虽说号称是最popular的LDA工具包,不过依然有明显的bug,参考“【LDA】修正 GibbsLDA++-0.2 中的两个内存问题”。
2. “GibbsL...
分类:
其他好文 时间:
2015-07-14 23:59:57
阅读次数:
347
1,说明
本文对LDA原始论文的作者所提供的C代码中LDA的主要逻辑部分做注释,代码可在这里下载:https://github.com/Blei-Lab/lda-c
这份代码实现论文《Latent Dirichlet Allocation》中介绍的LDA模型,用变分EM算法求解参数。
为了使代码在vs2013中运行做了一些微小改动,但不影响原代码的逻辑。
vs2013工程可在我的资源中...
分类:
其他好文 时间:
2015-07-02 15:49:14
阅读次数:
278
这一步,我们根据E-step得到的γ,phi\gamma,phi,最大化L(γ,?;α,β)L(\gamma,\phi;\alpha,\beta),得到α,β\alpha,\beta.1,拉格朗日乘数法求解β\beta 首先把L(γ,?;α,β)L(\gamma,\phi;\alpha,\beta)简化,只保留与β\beta有关的部分。因为β\beta是每一行存一个主题的词分布,所以每一行的...
分类:
其他好文 时间:
2015-07-02 12:08:22
阅读次数:
229
MPI 是“Message Passing Interface”的缩写,通常用来做单机多线程的并发编程。
1. GibbsLDA++中训练框架大致如下:
循环:训练过程迭代N次
{
循环:遍历每一个训练样本(指doc)
{
循环:遍历训练样本中的每一个word
{
循环:gibbs采样过...
分类:
其他好文 时间:
2015-06-21 18:33:37
阅读次数:
237