文本分类问题:给定文档p(可能含有标题t),将文档分类为n个类别中的一个或多个 文本分类应用:常见的有垃圾邮件识别,情感分析 文本分类方向:主要有二分类,多分类,多标签分类 文本分类方法:传统机器学习方法(贝叶斯,svm等),深度学习方法(fastText,TextCNN等) 文本分类的处理大致分为 ...
分类:
其他好文 时间:
2018-10-12 13:47:17
阅读次数:
578
Python:电商产品评论数据情感分析,jieba分词,LDA模型 ...
分类:
编程语言 时间:
2018-10-02 13:57:14
阅读次数:
529
如下图这样的数据: 即文档中某个字段是一个数组,而每个数组元素又是一个对象,现在需求是对每个对象中的 字段值作情感分析后,把情感分析得到的结果增加到这个对象中去。 如上图中第1个元素,修改后的结果应该是这样的: 也就是多了最后的那个 。情感分析的过程是另外的话题,这里只讲mongodb的更新语句。 ...
分类:
数据库 时间:
2018-09-18 23:55:17
阅读次数:
422
每个文本文件包含相对应类的数据(0:喜悦1:愤怒2:厌恶3:低落对应不同类别的感情) main.py tools.py ...
分类:
其他好文 时间:
2018-09-16 16:21:03
阅读次数:
892
Boson:是一款语义挖掘工具,可以对文本内容进行情感分析,能够将文本按照预设的分类体系进行自动区分实现信息分类,能够从文本中发现有意义的信息从而进行实体识别,还能够自动对给定的文本进行话题聚类,将语义上相似的内容归为一类,有助于海量文档、资讯的整理,和话题级别的统计分析。 BosonNLP:中文语 ...
分类:
其他好文 时间:
2018-08-04 20:25:00
阅读次数:
141
今日完成任务情况 杜世康:弹幕数据的分析 刘丹:弹幕数据的分析 李玉莹:弹幕数据的分析 曹莹雯:数据可视化 尹楠: 数据可视化 王静雅:数据可视化并撰写Beta冲刺博文 以下是英雄联盟直播间部分弹幕数据的分析结果 关键字提取 文本分类 情感分析 从情感分析结果来看,网友的负面情绪58.93%,正面情 ...
分类:
其他好文 时间:
2018-06-26 22:37:47
阅读次数:
240
NLPIR能够全方位多角度满足应用者对大数据文本的处理需求,包括大数据完整的技术链条:网络采集、正文提取、中英文分词、词性标注、实体抽取、词频统计、关键词提取、语义信息抽取、文本分类、情感分析、语义深度扩展、繁简编码转换、自动注音、文本聚类等。 ...
分类:
编程语言 时间:
2018-06-22 13:29:29
阅读次数:
215
最近尝试了一下中文的情感分析。 主要使用了Glove和LSTM。语料数据集采用的是中文酒店评价语料 1、首先是训练Glove,获得词向量(这里是用的300d)。这一步使用的是jieba分词和中文维基。 2、将中文酒店评价语料进行清洗,并分词。分词后转化为词向量的表示形式。 3、使用LSTM网络进行训 ...
分类:
其他好文 时间:
2018-06-14 18:28:20
阅读次数:
889
来自:Python数据分析与数据化运营——宋天龙著 1. 分析方法与过程 本次建模针对京东商城上“美的”品牌热水器的消费者评论数据,在对文本进行基本的机器预处理、中文分词、停用词过滤后,通过建立包括栈式自编码深度学习、语义网络与LDA主题模型等多种数据挖掘模型,实现对文本评论数据的倾向性判断以及所隐 ...
分类:
其他好文 时间:
2018-06-12 19:38:05
阅读次数:
437