码迷,mamicode.com
首页 >  
搜索关键字:分类器    ( 1373个结果
利用shuf对数据记录进行随机采样
最近在用SVM为分类器做实验,但是发现数据量太大(2000k条记录)但是训练时间过长...让我足足等了1天的啊!有人指导说可以先进行一下随机采样,再训练,这样对训练结果不会有太大影响(这个待考证)。所以就对数据进行了一下降采样,具体方法如下:shuf data | head -n 100000其中,...
分类:其他好文   时间:2014-08-01 13:31:11    阅读次数:327
文本分类,数据挖掘和机器学习
转自:http://blog.chinaunix.net/uid-446337-id-94440.html分类:机器学习的有概率分类器(probabilistic) ,贝叶斯推理网络(bayesian inference networks) , 决策树分类器(decision tree) ,决策规则...
分类:其他好文   时间:2014-07-31 19:33:17    阅读次数:411
SVM 支持向量机
(支持向量机)support vector machine是一种二分类模型,是寻求结构风险最小,实现经验和置信范围最小化。它的基本模型是定义在特征空间上的间隔最大化的线性分类器,间隔最大化使得它有区别于感知机,并且是唯一的。学习策略:间隔最大化(解凸二次规划的问题)线性分类器也叫感知机,就是在N维的...
分类:其他好文   时间:2014-07-30 00:30:52    阅读次数:355
RandomForest随机森林总结
1.随机森林原理介绍随机森林,指的是利用多棵树对样本进行训练并预测的一种分类器。该分类器最早由Leo Breiman和Adele Cutler提出,并被注册成了商标。简单来说,随机森林就是由多棵CART(Classification And Regression Tree)构成的。对于每棵树,它们使...
分类:其他好文   时间:2014-07-28 02:52:49    阅读次数:400
Struck跟踪算法(一)
Struct跟踪算法,自适应的一边跟踪,一边检测的跟踪目标物体算法,类似于TLD算法,运用了SVM分类器,HAAR特征等特征提取算法。。。...
分类:其他好文   时间:2014-07-27 11:36:56    阅读次数:360
[模式识别].(希腊)西奥多里蒂斯<第四版>笔记9之__context-based classification
本章的假设前提是不同类之间存在相关性。连续的特征向量不是孤立的。     1,贝叶斯分类器     2,马尔科夫链模型     3,the viterbi algorithm     4, 信道均衡(channel equalization):任务是回复被传输通道或者噪音破坏的信息序列。 5,隐式马尔科夫模型 6,带状态持续模型(state duration model)的HMM ...
分类:其他好文   时间:2014-07-25 11:05:21    阅读次数:296
大数据时代的机器学习
张长水:大数据时代的机器学习 VS 传统机器学习 从机器学习角度看,“大数据”指的是数据量大,数据本身不够精确,数据混杂,数据自然产生。机器学习对大数据的处理的两个挑战: 数据量大导致计算困难 分布在不同服务器上的数据存在一定联系,这些数据基本上不满足“独立同分布”假设,传统的模型和算法很难适应。 大数据时代给机器学习带来新的机遇: 在某些应用条件下,高维空间中的局部数据变得稠密。这个现象可以为分类器的设计提供更丰富的信息。甚至使分类器在性能上接近理论极限性能。 大数据使样本空间原本“空旷”的区域出现样本,...
分类:其他好文   时间:2014-07-24 23:37:33    阅读次数:370
目标检測的图像特征提取之(一)HOG特征
1、HOG特征: 方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检測的特征描写叙述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检測中...
分类:其他好文   时间:2014-07-23 14:53:26    阅读次数:281
[模式识别].(希腊)西奥多里蒂斯<第四版>笔记5之__特征选取
1,引言 有关模式识别的一个主要问题是维数灾难。我们将在第7章看到维数很容易变得很大。     降低维数的必要性有几方面的原因。计算复杂度是一个方面。另一个有关分类器的泛化性能。     因此,本章的主要任务是:在尽可能保留特征的分类判别信息前提下,来选择重要的和维数少的特征量。这个过程被称作特征选择或者特征降维。     定量描述来讲,选择的特征应该使得类内距离减小,类间距离增大。...
分类:其他好文   时间:2014-07-20 10:14:09    阅读次数:207
文本分类之情感分析– 准确率和召回率
Accuracy不是评估分类器的有效性的唯一度量。另外两个有用的指标是precision和recall。这两个度量可提供二元分类器的性能特征的更多视角。 分类器的 Precision Precision度量一个分类器的正确性。较高的精确度意味着更少的误报,而较低精度意味着更多的误报。这是经常与recall相反,作为一种简单的方法来提高精度,以减少召回。 分类器的 Re...
分类:其他好文   时间:2014-07-19 11:26:04    阅读次数:1829
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!