码迷,mamicode.com
首页 >  
搜索关键字:信息理论    ( 13个结果
python: 知乎大规模(34k)用户爬虫
前些天学习python,完成了python练习册的大部分习题:https://github.com/Show-Me-the-Code/python(我的github上有习题代码,欢迎自取)。之后看到@salamer的一个python爬虫项目,觉得很不错。于是自己花了4天的时间完成了一个大规模爬取知乎用户信息的爬虫,由于个人网络原因,爬取12小时,获得了34k用户的信息(理论上可以爬全站的信息,可能...
分类:编程语言   时间:2016-05-07 07:16:31    阅读次数:267
相似算法 ,Java实例9 - 汉明距离 Hamming Distance
Java实例9 - 汉明距离 Hamming Distance http://blog.csdn.net/kindterry/article/details/6581344 /**在信息理论中,两个等长字符串之间的汉明距离 * 是两个字符串对应位置上不同字符的个数, * 换句话说,汉明距离就是将一个 ...
分类:编程语言   时间:2016-04-20 00:21:24    阅读次数:799
LDA主题模型评估
LDA主题模型好坏的评估,判断改进的参数或者算法的建模能力。 Blei先生在论文《Latent Dirichlet Allocation》实验中用的是Perplexity值作为评判标准。 一、Perplexity定义 http://en.wikipedia.org/wiki/Perplexity perplexity是一种信息理论的测量方法,b的perplexity值定义为基于b的...
分类:其他好文   时间:2015-01-06 17:58:56    阅读次数:232
13条   上一页 1 2
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!