1. 概述 系统聚类法也称为多层次聚类法,分类的单位由高到低呈树状结构,且所处的位置越低其包含的样本点就越少,共同特征越多。这种方法适合于数据量较小的情况,当数据量较大时系统聚类法的速度较慢。 2. 算法核心思想 其做法是开始时把每个样品作为一类,然后把最靠近的两个或若干个样品(即距离最小的群品)首 ...
分类:
其他好文 时间:
2020-02-06 13:04:45
阅读次数:
131
KNN分类算法:一个样本i与距离样本i最近的k个样本归属于同一类,如果k个样本属于不同的分类,则样本i属于k个中大多数样本所属的那一类 ①距离的定义:分为两种 第一种距离 L1:曼哈顿距离 第二种距离 L2:欧氏距离 ②K:k=1时,退化为最邻近算法;应存在一个k使得算法整体最优 ③算法过程: st ...
分类:
编程语言 时间:
2020-01-20 23:09:34
阅读次数:
153
二、基本概念 1 有监督学习与无监督学习 根据样本数据是否带有标签值,可以将机器学习算法分成有监督学习和无监督学习两类。有监督学习的样本数据带有标签值,它从训练样本中学习得到一个模型,然后用这个模型对新的样本进行预测推断。有监督学习的典型代表是分类问题和回归问题。 无监督学习对没有标签的样本进行分析 ...
分类:
其他好文 时间:
2019-12-23 16:41:39
阅读次数:
140
1. 欧氏距离(Euclidean Distance) 欧氏距离是最容易直观理解的距离度量方法,我们小学、初中和高中接触到的两个点在空间中的距离一般都是指欧氏距离。 二维平面上点a(x1,y1)与b(x2,y2)间的欧氏距离: 三维空间点a(x1,y1,z1)与b(x2,y2,z2)间的欧氏距离: ...
分类:
其他好文 时间:
2019-12-02 18:35:57
阅读次数:
109
分类算法-k近邻算法(KNN): 定义: 如果一个样本在特征空间中的k个最相似 (即特征空间中最邻近) 的样本中的大多数属于某一个类别,则该样本也属于这个类别 来源: KNN算法最早是由Cover和Hart提出的一种分类算法 计算距离公式: 两个样本的距离可以通过如下公式计算,又叫欧氏距离,比如说 ...
分类:
编程语言 时间:
2019-11-03 16:39:16
阅读次数:
174
[TOC]更新、更全的《机器学习》的更新网站,更有python、go、数据结构与算法、爬虫、人工智能教学等着你:https://www.cnblogs.com/nickchen121/# 线性回归线性回归是比较经典的线性模型,属于监督学习中预测值为连续值的回归问题。线性回归针对的是一个或多个特征与连... ...
分类:
其他好文 时间:
2019-10-16 17:47:05
阅读次数:
82
[TOC] 机器学习中的距离 机器学习任务中,常用的距离公式有以下几种: 1. 欧式距离(又称欧几里得距离) 2. 曼哈顿距离(又称城市街区距离) 3. 切比雪夫距离 4. 闵氏距离(又称闵可夫斯基距离) 5. 标准化欧式距离 6. 余弦距离 (一)欧式距离 公式: $$ d = \sqrt{(a ...
分类:
其他好文 时间:
2019-10-12 01:35:26
阅读次数:
104
作为聚类的代表算法,k-means本属于NP难问题,通过迭代优化的方式,可以求解出近似解。 伪代码如下: 1,算法部分 距离采用欧氏距离。参数默认值随意选的。 2,验证 我随机出了一些平面上的点,然后对其分类。 首先看看未分类之前的,当然也是跟分类后的分布是一样的。 然后看看分类后的结果: 可以看出 ...
分类:
编程语言 时间:
2019-10-11 23:19:06
阅读次数:
189
转自: https://www.cnblogs.com/denny402/p/7027954.html 1. 欧氏距离(Euclidean Distance) 欧氏距离是最易于理解的一种距离计算方法,源自欧氏空间中两点间的距离公式。(1)二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离: ...
分类:
编程语言 时间:
2019-09-27 10:35:00
阅读次数:
99
@[TOC] "A pure L1 norm principal component analysis" 虽然没有完全弄清楚其中的数学内涵,但是觉得有趣,记录一下. 问题 众所周知,一般的PCA(论文中以$L_2 PCA$表示)利用二范数构造损失函数并求解,但是有一个问题就是会对异常值非常敏感. 所 ...
分类:
其他好文 时间:
2019-08-31 21:03:36
阅读次数:
59