搜索关键字：文本分类，搜索到340个结果！码迷,mamicode.com！

DOM

1.认识DOM 1.1定义:html中所有对象都可以被视为节点,包括属性和文本 1.2分类:元素1;属性2;文本3;文档9;(其余还有注释节点等等...)2.访问相关节点 2.1从高到低 document.head.title.........document.body.firstChild;...

分类：其他好文时间：2014-10-02 23:18:33 阅读次数：291

SVM入门（三）线性分类器Part 2

上回说到对于文本分类这样的不适定问题（有一个以上解的问题称为不适定问题），需要有一个指标来衡量解决方案（即我们通过训练建立的分类模型）的好坏，而分类间隔是一个比较好的指标。在进行文本分类的时候，我们可以让计算机这样来看待我们提供给它的训练样本，每一个样本由..

分类：其他好文时间：2014-10-01 01:07:21 阅读次数：535

基于朴素贝叶斯分类器的文本分类算法

源代码下载：NaviveBayesClassify.rarPreface文本的分类和聚类是一个比较有意思的话题，我以前也写过一篇blog《基于K-Means的文本聚类算法》，加上最近读了几本数据挖掘和机器学习的书籍，因此很想写点东西来记录下学习的所得。在本文的上半部分《基于朴素贝叶斯分类器的文本分类...

分类：其他好文时间：2014-09-18 22:02:34 阅读次数：325

【甘道夫】用贝叶斯文本分类测试打过1329-3.patch的Mahout0.9 on Hadoop2.2.0

引言接前一篇文章《【甘道夫】Mahout0.9 打patch使其支持 Hadoop2.2.0》 http://blog.csdn.net/u010967382/article/details/39088035，为Mahout0.9打过Patch编译成功后，使用贝叶斯文本分类来测试Mahout0.9对Hadoop2.2.0的兼容性。步...

分类：其他好文时间：2014-09-05 23:49:02 阅读次数：285

K-means算法及文本聚类实践

K-Means是常用的聚类算法，与其他聚类算法相比，其时间复杂度低，聚类的效果也还不错，本文介绍一下k-means算法并在文本分类上应用。

分类：其他好文时间：2014-08-18 18:08:12 阅读次数：318

文本分类——机器学习常用工具

文本分类现已比较成熟，各类开源工具不少，现推荐几个比较常用简单的工具：1、scikit-learn：http://scikit-learn.org/stable/index.html python编写调用，里面有各种分类算法svm、随机森林、贝叶斯等，和特征提取，如字、ngram等，几行代码便可以构...

分类：其他好文时间：2014-08-18 17:52:42 阅读次数：193

文本分类，数据挖掘和机器学习

转自：http://blog.chinaunix.net/uid-446337-id-94440.html分类：机器学习的有概率分类器(probabilistic) ,贝叶斯推理网络(bayesian inference networks) , 决策树分类器(decision tree) ,决策规则...

分类：其他好文时间：2014-07-31 19:33:17 阅读次数：411

Weka学习 -- StringToWordVector 源码学习（1）

在文本分类和聚类种，都会对文本进行切词分词，然后转化为向量，最后求其TFIDF值，余弦相似性等。本文将介绍了WEKA源码中StringToWordVector中的源码知识，自己也可以基于这个类构建符合自己需求的StringToWordVector类。...

分类：其他好文时间：2014-07-22 23:58:49 阅读次数：640

文本分类之情感分析– 准确率和召回率

Accuracy不是评估分类器的有效性的唯一度量。另外两个有用的指标是precision和recall。这两个度量可提供二元分类器的性能特征的更多视角。分类器的 Precision Precision度量一个分类器的正确性。较高的精确度意味着更少的误报，而较低精度意味着更多的误报。这是经常与recall相反，作为一种简单的方法来提高精度，以减少召回。分类器的 Re...

分类：其他好文时间：2014-07-19 11:26:04 阅读次数：1829

文本分类之情感分析– 停用词和惯用语

改善特征提取往往可以对分类的accuracy（和precision和召回率）有显著的正面影响。在本文中，我将评估word_feats的两项修改特征提取的方法：过滤停用词包含二元语法搭配为了有效地做到这一点，我们将修改前面的代码，这样我们就可以使用任意的特征提取函数，它接收一个文件中的词，并返回特征字典。和以前一样，我们将使用这些特征来训练朴素贝叶斯分类器。 ...

分类：其他好文时间：2014-07-19 11:22:04 阅读次数：593

共340条上一页 1 ... 31 32 33 34 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)