码迷,mamicode.com
首页 > 其他好文 > 详细

数学之路(机器学习实践指南)-文本挖掘与NLP(5)

时间:2016-02-02 15:10:51      阅读:196      评论:0      收藏:0      [点我收藏+]

标签:

#条件频率,每个词条在不同分类中出现的频率
print "------------------"
cfd=nltk.ConditionalFreqDist(samplewords)   
fdist=cfd[u‘财经‘]
for word in fdist:
    print word
print "---------流动性出现次数-----------"
print cfd[u‘财经‘][u‘流动性‘]
print "----------条件:分类----------"
for cnd in cfd.conditions():
    print cnd
print "---------------------------"
print cfd[u‘财经‘].max()
#条件频率分布表
print "----------条件频率分布表----------"
cfd.tabulate(title=u‘条件频率分布表‘,conditions=[u‘科技‘,u‘财经‘])
cfd.plot(title=u‘条件频率分布图‘,conditions=[u‘科技‘,u‘财经‘])


本博客所有内容是原创,如果转载请注明来源

http://blog.csdn.net/myhaspl/


技术分享

数学之路(机器学习实践指南)-文本挖掘与NLP(5)

标签:

原文地址:http://blog.csdn.net/myhaspl/article/details/50623178

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!