# 介绍 k近邻算法(KNN)属于监督学习的分类算法,通过测量不同特征值之间的距离进行分类,算法过程如下 * 计算数据点与已知数据集中每个点的距离 * 对距离从小到大进行排序 * 选取前k个距离值 * 确定前k个距离值所在类别的出现的概率 * 将前k个点出现频率最高的类别作为当前数据的预测分类 主要... ...
分类:
编程语言 时间:
2020-02-01 00:48:24
阅读次数:
87
局部加权回归( locally weighted regression ) 特征选择问题:underfitting,overfitting parametric learing algorithm:有固定数目的参数以用来数据拟合的算法; Non parametric learing algorith ...
分类:
其他好文 时间:
2020-01-29 18:23:37
阅读次数:
97
[TOC] logistic 回归算法 一种常见的分类算法,输出值在0,1之间 是:1 否:0 即找到满足下面条件的最优参数 $0 \leq h_{\theta}(x) \leq 1$ 假设函数的表示方法: $h_{\theta}(x)=g\left(\theta^{T} x\right)$ 其中: ...
分类:
其他好文 时间:
2020-01-24 21:14:27
阅读次数:
113
在上一篇中,我们学习了线性回归,这一次来看看k近邻的表现 K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:在特征空间中,如果一个样本附近的k个最近(即特征空间中最邻近)样本的大多数属于某一个类别,则该样本也属 ...
分类:
其他好文 时间:
2020-01-24 15:48:29
阅读次数:
82
KNN分类算法:一个样本i与距离样本i最近的k个样本归属于同一类,如果k个样本属于不同的分类,则样本i属于k个中大多数样本所属的那一类 ①距离的定义:分为两种 第一种距离 L1:曼哈顿距离 第二种距离 L2:欧氏距离 ②K:k=1时,退化为最邻近算法;应存在一个k使得算法整体最优 ③算法过程: st ...
分类:
编程语言 时间:
2020-01-20 23:09:34
阅读次数:
153
一、朴素的贝叶斯算法原理 贝叶斯分类算法以样本可能属于某类的概率来作为分类依据,朴素贝叶斯分类算法是贝叶斯分类算法中最简单的一种,朴素的意思是条件概率独立性。 条件概率的三个重要公式: (1)概率乘法公式: P(AB)= P(B) P(A|B) = P(A) P(B|A) =P(BA) (2)全概率 ...
分类:
编程语言 时间:
2020-01-19 17:45:08
阅读次数:
79
Python3.7之继承 一、什么叫继承 继承是一种创建新类的方式,新建的类可以继承一个或多个父类(python支持多继承),父类又可称为基类或超 类,新建的类称为派生类或子类。子类会“”遗传”父类的属性,从而解决代码重用问题。 单继承与多继承 经典类与新式类 只有在python2中才分新式类和经典 ...
分类:
编程语言 时间:
2020-01-17 11:34:26
阅读次数:
85
@[toc] 1 聚类的定义 聚类就是对大量未知标注的数据集,按照数据 内部存在的数据特征 将数据集划分为多个不同的类别,使类别内的数据比较相似,类别之间的数据相似度比较小;属于 无监督学习 。 聚类算法的重点是计算样本项之间的 相似度 ,有时候也称为样本间的 距离 。 和分类算法的区别: 分类算法 ...
分类:
编程语言 时间:
2020-01-04 01:38:28
阅读次数:
134
一、什么是类不平衡 在分类中经常会遇到:某些类别数据特别多,某类或者几类数据特别少。如二分类中,一种类别(反例)数据特别多,另一种类别(正例)数据少的可怜。如银行欺诈问题,客户流失问题,电力盗窃以及罕见疾病识别等都存在着数据类别不均衡的情况。 二、为什么要对类不平衡进行特殊处理 传统的分类算法旨在最 ...
分类:
其他好文 时间:
2020-01-02 16:04:53
阅读次数:
484
概括:朴素贝叶斯分类器(Naïve Bayes classifier)是一种相当简单常见但是又相当有效的分类算法,在监督学习领域有着很重要的应用。朴素贝叶斯是建立在“全概率公式”的基础下的,由已知的尽可能多的事件A、B求得的P(A|B)来推断未知P(B|A),是的有点玄学的意思,敲黑板!!! 优点: ...
分类:
其他好文 时间:
2019-12-13 14:20:21
阅读次数:
295