KNN算法原理 KNN(K-Nearest Neighbor)最邻近分类算法是数据挖掘分类(classification)技术中最简单的算法之一,其指导思想是”近朱者赤,近墨者黑“,即由你的邻居来推断出你的类别。 KNN最邻近分类算法的实现原理:为了判断未知样本的类别,以所有已知类别的样本作为参照, ...
分类:
编程语言 时间:
2019-08-16 00:52:58
阅读次数:
94
之前介绍了这么多分类模型的性能评价指标(《分类模型的性能评价指标(Classification Model Performance Evaluation Metric)》),那么到底应该选择哪些指标来评估自己的模型呢?答案是应根据应用场景进行选择。 查全率(Recall):recall是相对真实的情 ...
分类:
其他好文 时间:
2019-07-24 20:48:26
阅读次数:
857
1.为什么不用Regression? 用Regression显然会得到紫色线,而不是绿线 2.定义Loss Function 即分类不正确的样本个数 3.求每个元素在某个类别的概率 p(class1|x) = p(x|class1)p(class1) / [p(x|class1)p(class1) ...
分类:
其他好文 时间:
2019-07-12 14:25:07
阅读次数:
86
1. 概述条件随机场(Conditional Random Field, CRF)是概率图模型(Probabilistic Graphical Model)与区分性分类( Discriminative Classification)的一种接合,能够用来对“结构预测”(structured predi ...
分类:
其他好文 时间:
2019-07-12 09:22:12
阅读次数:
126
计算机视觉的任务很多,有图像分类、目标检测、语义分割、实例分割和全景分割等,那它们的区别是什么呢? 1、Image Classification(图像分类) 图像分类(下图左)就是对图像判断出所属的分类,比如在学习分类中数据集有人(person)、羊(sheep)、狗(dog)和猫(cat)四种,图 ...
分类:
其他好文 时间:
2019-07-09 00:03:30
阅读次数:
328
分类问题就像披着羊皮的狼,看起来天真无害用起来天雷滚滚。比如在建模前你思考过下面的问题么? 你的分类模型输出的概率只是用来做样本间的相对排序,还是概率本身? 你的训练数据本身分布如何是否存在Imbalanced Sample? 要是您都想到了拜拜??。要是有1各您感兴趣的问题,那就接着往下看吧。本来 ...
分类:
其他好文 时间:
2019-07-03 00:40:35
阅读次数:
99
在解决分类问题的时候,可以选择的评价指标简直不要太多。但基本可以分成两2大类,我们今分别来说道说道 基于一个概率阈值判断在该阈值下预测的准确率 衡量模型整体表现(在各个阈值下)的评价指标 在说指标之前,咱先把分类问题中会遇到的所有情况简单过一遍。36度的北京让我们举个凉快一点的例子 我们预测会不会下 ...
分类:
其他好文 时间:
2019-07-01 10:42:29
阅读次数:
98
1. 概念: https://scikit-learn.org/stable/modules/neighbors.html 1. Cover和Hart在1968年提出了最初的临近算法 2. 分类算法(classification) 3. 输入基于实例的学习(instance-based leanin ...
分类:
编程语言 时间:
2019-06-26 16:33:17
阅读次数:
137
Data arrangement 1.Reference Webs http://nlp.csai.tsinghua.edu.cn/~tcc/ https://blog.csdn.net/a609640147/article/details/89562262 https://blog.csdn.ne ...
分类:
Web程序 时间:
2019-06-25 17:21:17
阅读次数:
207
转自https://mp.weixin.qq.com/s?__biz=MzI5MDUyMDIxNA==&mid=2247486778&idx=2&sn=23582d015eff1d0d5ba0c6f71ca86296&chksm=ec1fe0c3db6869d588af077e6041377193c ...
分类:
其他好文 时间:
2019-06-23 17:28:41
阅读次数:
87