摘要 这篇短文的目的是分享我这几天里从头开始学习Python爬虫技术的经验,并展示对爬取的文本进行情感分析(文本分类)的一些挖掘结果。 不同于其他专注爬虫技术的介绍,这里首先阐述爬取网络数据动机,接着以豆瓣影评为例介绍文本数据的爬取,最后使用文本分类的技术以一种机器学习的方式进行情感分析。由于内容覆 ...
分类:
编程语言 时间:
2019-01-19 13:52:20
阅读次数:
200
自然语言处理NLP( natural language process)是这几年越来越火了,kaggle上的比赛有关NLP的也日渐多起来了. NLP的应用场景很多,情感分析,邮件过滤,ai客服,机器翻译等等等等,就像这几年越来越火有成为BAT之后第四极的今日头条,为什么能够为每个人推送不同的感兴趣的 ...
分类:
编程语言 时间:
2018-12-24 17:19:03
阅读次数:
397
简介: BERT,全称Bidirectional Encoder Representations from Transformers,是一个预训练的语言模型,可以通过它得到文本表示,然后用于下游任务,比如文本分类,问答系统,情感分析等任务.BERT像是word2vec的加强版,同样是预训练得到词级别 ...
分类:
其他好文 时间:
2018-12-17 17:34:58
阅读次数:
326
基于TextCNN汽车行业评论文本的情感分析 使用卷积神经网络对汽车行业评论文本进行情感分析。 数据集 爬取汽车之家车主口碑评论文本,抽取口碑中最满意以及最不满意评论文本,分别作为正向情感语料库和负向情感语料库。 语料库基本信息如下: 预处理 utils.py为数据的预处理代码。 经过数据预处理,数 ...
分类:
其他好文 时间:
2018-11-24 14:11:55
阅读次数:
726
环境 win8, python3.7, jupyter notebook 正文 什么是情感分析?(以下引用百度百科定义) 情感分析(Sentiment analysis),又称倾向性分析,意见抽取(Opinion extraction),意见挖掘(Opinion mining),情感挖掘(Senti ...
分类:
编程语言 时间:
2018-11-16 14:00:17
阅读次数:
227
之前在实习时,Boss想利用情感分析实现“公司绩效考核”问题,即从Boss对员工的评语中判断该员工该月的绩效值,属情感分析领域。 当时使用最简单的基于情感词典的方法解决,借鉴了这篇文章,在此基础上对其进行修改,先讲思路描述如下。 1 词典准备 情感词典(BosonNLP情感词典) 停用词典 否定词典 ...
分类:
其他好文 时间:
2018-11-08 18:29:54
阅读次数:
856
一. why sequence models? (1)序列模型广泛应用于语音识别,音乐生成,情感分析,DNA序列分析,机器翻译,视频行为识别,命名实体识别等众多领域。 (2)上面那些问题可以看成使用(x,y)作为训练集的监督学习,但是输入与输出的对应关系有非常多的组合, 比如一对一,多对多,一对多, ...
分类:
其他好文 时间:
2018-11-02 23:52:18
阅读次数:
250
在这篇博文中,我将向您介绍这篇非常好且写得很好的MSDN文章示例,然后在ANNdotNET中实现该示例。 ...
分类:
Web程序 时间:
2018-11-01 22:36:57
阅读次数:
269
最近在做NLP相关项目,包括句法分析、情感分析等,有大量数据需要标注。我评估了几个文本标注工具,也接触了几家数据标注公司和平台,总结如下,供各位参考。文本标注平台(标注外包公司)数据标注公司的工作比较多样,文本数据标注是最基础的,另外语音、图片、视频标注也都可以做。目前这个行业良莠不齐,有的平台技术实力强,有品牌背景,比如京东众智、百度众包,数据保密做得好。有的平台是专门做代理的,你的数据需求交给
分类:
其他好文 时间:
2018-10-31 17:00:26
阅读次数:
2286
最近在做NLP相关项目,包括句法分析、情感分析等,有大量数据需要标注。我评估了几个文本标注工具,也接触了几家数据标注公司和平台,总结如下,供各位参考。 文本标注平台(标注外包公司) 数据标注公司的工作比较多样,文本数据标注是最基础的,另外语音、图片、视频标注也都可以做。目前这个行业良莠不齐,有的平台 ...
分类:
其他好文 时间:
2018-10-31 12:38:11
阅读次数:
330