标签:weight .net aliyun key sdn 中文分词 art 常用 mil
http://blog.csdn.net/a_step_further/article/details/51176959
LDA是文本挖掘中常用的主题模型,用来从大量文档中提取出最能表达各个主题的一些关键词,具体算法原理可参阅KM上相关文章。笔者因业务需求,需对腾讯微博上若干账号的消息进行主题提取,故而尝试了一下该算法,基于python的gensim包实现一个简单的分析。
另外还有一些学习资料:https://yq.aliyun.com/articles/26029 [python] LDA处理文档主题分布代码入门笔记
标签:weight .net aliyun key sdn 中文分词 art 常用 mil
原文地址:http://www.cnblogs.com/flippedkiki/p/7131267.html