码迷,mamicode.com
首页 >  
搜索关键字:情感分析    ( 146个结果
经典的观点挖掘算法(文本挖掘系列)
最近阅读了美国伊利诺伊大学教授刘兵的一篇关于观点挖掘的KDD论文(Mining and Summarizing Customer Reviews),其观点挖掘算法非常经典,特此做记录,互相探讨。...
分类:其他好文   时间:2014-08-31 12:00:01    阅读次数:701
文本分类之情感分析– 准确率和召回率
Accuracy不是评估分类器的有效性的唯一度量。另外两个有用的指标是precision和recall。这两个度量可提供二元分类器的性能特征的更多视角。 分类器的 Precision Precision度量一个分类器的正确性。较高的精确度意味着更少的误报,而较低精度意味着更多的误报。这是经常与recall相反,作为一种简单的方法来提高精度,以减少召回。 分类器的 Re...
分类:其他好文   时间:2014-07-19 11:26:04    阅读次数:1829
文本分类之情感分析– 去除低信息量的特征
当你的分类模型有数百个或数千个特征,由于是文本分类的情况下,许多(如果不是大多数)的特点是低信息量的,这是一个不错的选择。这些特征对所有类都是通用的,因此在分类过程中作出很小贡献。个别是无害的,但汇总的话,低信息量的特征会降低性能。 通过消除噪声数据给你的模型清晰度,这样就去除了低信息量特征。它可以把你从过拟合和维数灾难中救出来。当你只使用更高的信息特征,可以提高性能,同时也降低了模型的大小...
分类:其他好文   时间:2014-07-19 11:22:54    阅读次数:507
文本分类之情感分析– 停用词和惯用语
改善特征提取往往可以对分类的accuracy(和precision和召回率)有显著的正面影响。在本文中,我将评估word_feats的两项修改特征提取的方法: 过滤停用词 包含二元语法搭配 为了有效地做到这一点,我们将修改前面的代码,这样我们就可以使用任意的特征提取函数,它接收一个文件中的词,并返回特征字典。和以前一样,我们将使用这些特征来训练朴素贝叶斯分类器。 ...
分类:其他好文   时间:2014-07-19 11:22:04    阅读次数:593
文本分类之情感分析 – 朴素贝叶斯分类器
情感分析正成为研究和社交媒体分析的热点领域,尤其是在用户评论和微博上。它是文本挖掘的一种特殊情况,一般关注在识别正反观点上,虽然它常不很准确,它仍然是有用的。为简单起见(因为训练数据容易获取),我将重点放在2个可能的情感分类:积极的和消极的。 NLTK 朴素贝叶斯分类 NLTK附带了所有你需要的情感分析的入手的东西:一份带有分为POS和NEG类别的电影评论语料,以及一些可训练分类器。我...
分类:其他好文   时间:2014-07-19 02:14:25    阅读次数:338
思路总结-----对微博情感分析的的挖掘
一朋友由于工作需要,准备对新浪微博进行相关的抓取挖掘。特别是情感分析这一块,便于他后期的实验实践。实际上,文本挖掘及分析在未来都会产生较大的效果。举一个简单的例子,现在地铁里的每个人每天都会去刷新自己的人人好友圈,微信好友消息。而这些消息大部分是基于文本的..
分类:其他好文   时间:2014-07-14 12:06:40    阅读次数:227
146条   上一页 1 ... 13 14 15
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!