1. 模型原理 1.1 论文 Yoon Kim在论文(2014 EMNLP) Convolutional Neural Networks for Sentence Classification提出TextCNN。 将卷积神经网络CNN应用到文本分类任务,利用多个不同size的kernel来提取句子中 ...
分类:
其他好文 时间:
2018-09-20 16:06:56
阅读次数:
226
文章1 Generative and Discriminative Text Classification with Recurrent Neural Networks 时间:2017 机构:Google DeepMind 生成模型:generative 判别模型:discrimination 作者 ...
分类:
其他好文 时间:
2018-09-08 17:40:43
阅读次数:
337
朴素贝叶斯模型是机器学习常用的模型算法之一,其在文本分类方面简单易行,且取得不错的分类效果。所以很受欢迎,对于朴素贝叶斯的学习,本文首先介绍理论知识即朴素贝叶斯相关概念和公式推导,为了加深理解,采用一个维基百科上面性别分类例子进行形式化描述。然后通过编程实现朴素贝叶斯分类算法,并在屏蔽社区言论、垃圾... ...
分类:
编程语言 时间:
2018-09-04 10:30:46
阅读次数:
182
文本分类任务框架: 文本→特征工程(决定着模型分类的上界)→分类器(逼近模型的上限)→类别 文本特征提取: 1.经典的文本特征(前人的研究的成熟理论) 2.手工构造新的特征(手工提取,看数据集中是否有好的性特征) 3.用神经网络提取(神经网络仅作为特征提取器来用) 经典的文本特征: TF、TFIDF ...
分类:
其他好文 时间:
2018-09-03 19:59:04
阅读次数:
161
**摘要**:本文主要讲述了用半监督算法做文本分类(二分类) 。先说结论,这是一个失败的例子,训练到第15000条就不行了,就报错了。如果你的数据量不是很大的话,可以操作一下。这里面有很多值得学习的地方,尤其是关于文本的预处理。后续还会更新,把这条路打通。 ...
分类:
编程语言 时间:
2018-08-24 20:42:00
阅读次数:
207
一 高斯朴素贝叶斯分类器代码实现 网上搜索不调用sklearn实现的朴素贝叶斯分类器基本很少,即使有也是结合文本分类的多项式或伯努利类型,因此自己写了一遍能直接封装的高斯类型NB分类器,当然与真正的源码相比少了很多属性和方法,有兴趣的可以自己添加。代码如下(有详细注释): 对于手动实现的高斯型NB分 ...
分类:
其他好文 时间:
2018-08-24 19:34:43
阅读次数:
214
我们使用了两种提取方式 1 .词频统计 2. 关键字提取 关键字提取的方式效果更好一些 第一步:数据读取 第二步:数据预处理,把每一行的内容拆分成一个个词 第三步: 与停用词库进行比对,去除内容中的停用词 ‘ 第四步构建模型,这里的数据我们需要做一步‘ ’.join的重连接,对于分类标签需要转换为数 ...
分类:
编程语言 时间:
2018-08-23 02:22:45
阅读次数:
248
用于文本分类的RNN-Attention网络 https://blog.csdn.net/thriving_fcl/article/details/73381217 Attention机制在NLP上最早是被用于seq2seq的翻译类任务中,如Neural Machine Translation by ...
分类:
其他好文 时间:
2018-08-20 12:26:57
阅读次数:
239
假设我们一句话有十个词,每个词语都可以用128维来表示,那么一句话就是一个10*128的矩阵图片。建立一个如下图的卷积神经网络:上面对这个图片进行卷积核大小分别为2、3、4的卷积计算形成feature_map最后通过softmax进行分类代码如下:#coding:utf-8importtensorflowastfimportnumpyasnpimportpickleclassTextCNN(obj
分类:
其他好文 时间:
2018-08-14 11:26:41
阅读次数:
254
"Awesome Repositories for Text Modeling" |repo|paper| |: :|: :| | "miracleyoo/DPCNN TextCNN Pytorch Inception" | "Deep Pyramid Convolutional Neural Ne ...
分类:
其他好文 时间:
2018-08-12 15:46:16
阅读次数:
1362