判别分析包括可用于分类和降维的方法。线性判别分析(LDA)特别受欢迎,因为它既是分类器又是降维技术。二次判别分析(QDA)是LDA的变体,允许数据的非线性分离。最后,正则化判别分析(RDA)是LDA和QDA之间的折衷。 本文主要关注LDA,并探讨其在理论和实践中作为分类和可视化技术的用途。由于QDA ...
分类:
编程语言 时间:
2019-05-06 19:33:01
阅读次数:
312
接收器操作特性(ROC)曲线可能是评估评分分类器的预测性能的最常用的度量。 预测正类(+1)和负类(-1)的分类器的混淆矩阵具有以下结构: 这里,TP表示真阳性的数量(模型正确预测正类),FP表示误报的数量(模型错误地预测正类),FN表示假阴性的数量(模型错误地预测阴性类),TN表示真阴性的数量(模 ...
分类:
编程语言 时间:
2019-05-06 19:20:51
阅读次数:
962
判别分析包括可用于分类和降维的方法。线性判别分析(LDA)特别受欢迎,因为它既是分类器又是降维技术。二次判别分析(QDA)是LDA的变体,允许数据的非线性分离。最后,正则化判别分析(RDA)是LDA和QDA之间的折衷。 本文主要关注LDA,并探讨其在理论和实践中作为分类和可视化技术的用途。由于QDA ...
分类:
其他好文 时间:
2019-05-06 19:07:09
阅读次数:
176
1、问题 有大量已经标好的垃圾邮件,此时需要建立一个垃圾邮件分类器。 2、得到x,y 在所有邮件当中选取1万到5万个出现频率很高的单词,把它作为属性(或者是标题,邮件地址等等),此时查看每个邮件,若该邮件中出现了哪个单词就把对应的属性置为1,否则为0,此时生成了x,每个样本都有了x。 例如: ...
分类:
其他好文 时间:
2019-05-03 16:06:07
阅读次数:
110
支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类(binary classification)的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解 ...
分类:
其他好文 时间:
2019-05-01 18:47:27
阅读次数:
157
1.贝叶斯公式 条件概率 p(B|A)=p(AB)p(A) 则 p(AB)=p(A)p(B|A) 全概率公式 p(A)=p(B1)p(A|B1)+p(B2)p(A|B2)+...+p(Bn)p(A|Bn) 贝叶斯公式 p(Bi|A)=p(ABi)p(A)=p(A|Bi)p(Bi)Σj=0np(A|B ...
分类:
其他好文 时间:
2019-04-18 10:54:25
阅读次数:
209
目录 简介 决策树简单用法 决策树算法检测P0P3爆破 决策树算法检测FTP爆破 简介 决策树和随机森林算法是最常见的分类算法; 决策树,判断的逻辑很多时候和人的思维非常接近。 随机森林算法,利用多棵决策树对样本进行训练并预测的一种分类器,并且其输出的类别是由个别决策树输出的类别的众数决定。 决策树 ...
分类:
编程语言 时间:
2019-04-15 19:53:29
阅读次数:
226
Machine Learing System Design(机器学习系统设计) Ways to improve the accuracy of a classifier(提高分类器准确性的几个方法) Collect lots of data (for example "honeypot" proje ...
分类:
其他好文 时间:
2019-04-10 12:03:50
阅读次数:
126
" " " " 很好理解,就是将一些基本的性能一般的弱分类器组合起来,来构成一个性能较好的强分类器;这其中如果数据一样的话那不是每次训练出的分类器就都一样了嘛,所以在每次训练后要根据训练结果来改变数据的权重;还有一个关键点是通过什么方法来组合这些弱分类器. " " " " " " " " 由8.2可 ...
分类:
其他好文 时间:
2019-04-06 17:12:28
阅读次数:
152