http://blog.csdn.net/weixin_36604953/article/details/78195462?locationNum=8&fps=1 文本分类需要CNN?No!fastText完美解决你的需求(前篇) fastText是个啥?简单一点说,就是一种可以得到和深度学习结果准 ...
分类:
其他好文 时间:
2017-11-27 14:16:45
阅读次数:
326
Output: The error rate is: 0.1 背景:为什么要做平滑处理? 零概率问题,就是在计算实例的概率时,如果某个量x,在观察样本库(训练集)中没有出现过,会导致整个实例的概率结果是0。在文本分类的问题中,当一个词语没有在训练样本中出现,该词语调概率为0,使用连乘计算文本出现概率 ...
分类:
编程语言 时间:
2017-11-19 17:25:21
阅读次数:
162
参考: Convolutional Neural Networks for Sentence Classification Convolutional Neural Networks for Sentence Classification Convolutional Neural Networks ...
分类:
其他好文 时间:
2017-11-12 18:43:39
阅读次数:
169
一 . 文本聚类介绍 文本聚类是文本挖掘(Text Mining)的重要手段和方法,也是数据挖掘的一个重要分支。文本聚类是一种无监督的文档分类,它把一个文本集分成若干称为簇(Cluster) 的子集,每个簇的文本之间具有较大的相似性,而簇间的文本具有较小的相似性。 二 . 文本聚类过程 文本聚类的过 ...
分类:
其他好文 时间:
2017-11-06 21:24:51
阅读次数:
674
为了更好的促进自然语言处理的发展:包括分词、文本分类、命名实体识别、句法分析、信息抽取、知识库构建、主题词识别、自动摘要、智能问答、语义理解、对话生成、话题推荐、语言模型、机器翻译、语义表示等方面在中文中的快速发展和广泛使用,必须很好的掌握汉语语法知识以及汉语词义网络的构建。本篇主要介绍汉语语法,汉 ...
分类:
其他好文 时间:
2017-11-04 21:40:54
阅读次数:
572
1 引言 1.1 队伍简介 队伍名“读机器学习日报长大的”,三位成员分别是“凡人哥”、“雨辰酱”和“yuye2311”,均来自苏州大学自然语言处理实验室。 1.2 任务简介 2017年4月17号AI100发布了为期一个月的文本分类练习赛,数据集由文因互联提供,要求参赛者根据所提供的脱敏后的企业文本数 ...
分类:
其他好文 时间:
2017-10-27 23:55:32
阅读次数:
806
一、传统文本分类方法 文本分类问题算是自然语言处理领域中一个非常经典的问题了,相关研究最早可以追溯到上世纪50年代,当时是通过专家规则(Pattern)进行分类,甚至在80年代初一度发展到利用知识工程建立专家系统,这样做的好处是短平快的解决top问题,但显然天花板非常低,不仅费时费力,覆盖的范围和准 ...
分类:
其他好文 时间:
2017-10-27 15:55:17
阅读次数:
185
首先: support vector classify(SVC)支持分类机做二分类的,找出分类面,解决分类问题 support vector regression(SCR)支持回归机做曲线拟合、函数回归 ,做预测,温度,天气,股票 这些都会用于数据挖掘、文本分类、语音识别、生物信息,具体问题具体分析 ...
分类:
其他好文 时间:
2017-10-16 12:18:31
阅读次数:
171
在介绍朴素贝叶斯分类之前,首先介绍一下大家都比较了解的贝叶斯定理,即已知某条件概率,如何得到两个时间交换后的概率, 也就是在已知P(A|B)的情况下如何求得P(B|A)?可以通过如下公式求得: 而朴素贝叶斯分类是一种简单的分类算法,称其朴素是因为其思想基础的简单性:就文本分类而言,它认为词袋中的两两 ...
分类:
编程语言 时间:
2017-10-15 14:13:28
阅读次数:
233
之前在新媒的时候做过用户画像的工作,当时主要是对文本进行打标签。 标签的抽取形式有两种,a) 文本分类的类标签; b)还有文本关键词的抽取和预先定义的标签体系的匹配。 但这其实也仅仅是一部分,比较全面的用户画像体系,应该包括 1. 浏览或购买商品的标签,也就是类似上面文本打标签的过程。 2. 通过访 ...
分类:
其他好文 时间:
2017-10-09 14:19:28
阅读次数:
148