机器学习的算法分为两大类:监督学习和无监督学习。 监督学习即在机器学习的过程中提供对错指示。一般是在数据组中包含最终结果(0,1),通过算法让机器减少误差。这一类学习主要应用于分类与预测(Regression & Classify)。监督学习从给定的训练数据集中学习出一个目标函数,当新的数据到来时, ...
分类:
系统相关 时间:
2020-02-01 12:42:08
阅读次数:
85
# 介绍 k近邻算法(KNN)属于监督学习的分类算法,通过测量不同特征值之间的距离进行分类,算法过程如下 * 计算数据点与已知数据集中每个点的距离 * 对距离从小到大进行排序 * 选取前k个距离值 * 确定前k个距离值所在类别的出现的概率 * 将前k个点出现频率最高的类别作为当前数据的预测分类 主要... ...
分类:
编程语言 时间:
2020-02-01 00:48:24
阅读次数:
87
Contrastive self supervised learning techniques are a promising class of methods that build representations by learning to encode what makes two thing ...
分类:
其他好文 时间:
2020-01-30 17:18:10
阅读次数:
1352
1.统计学习 统计学习的对象:(1)data : 计算机及互联网上的各种数字、文字、图像、视频、音频数据以及它们的组合。(2)数据的基本假设是同类数据具有一定的统计规律性。统计学习的目的:用于对数据(特别是未知数据) 进行预测和分析。统计学习的方法:(1)分类: 监督学习无监督学习半监督学习强化学习 ...
分类:
其他好文 时间:
2020-01-25 19:28:51
阅读次数:
155
聚类 非监督学习的算法 从未标记的数据中学习。所以,在非监督学习中我们要做的是给这种 没有标记的训练集合一个算法并且通过算法来为我们定义一些数据的结构。 对于这种结构的数据集,我们通过算法来发现他们 就像被分成两个聚类的点集 因此对于一种算法能够找到 被圈出来的类别,就称为聚类算法 比如说 到目前为 ...
分类:
其他好文 时间:
2020-01-20 14:51:02
阅读次数:
68
MLlib支持局部向量和矩阵存储在单台服务器,也支持存储于一个或者多个rdd的分布式矩阵 。局部向量和局部矩阵是用作公共接口的最简单的数据模型。 基本的线性代数运算由Breeze提供。在监督学习中使用的训练示例在MLlib中称为“标记点”。 因此,向量和 矩阵,标记点是 spark-mllib基本的 ...
分类:
其他好文 时间:
2020-01-18 21:17:43
阅读次数:
86
机器学习的专业术语非常多,不需要一开始理解所有的专业术语,这些术语会随着对机器学习的深入,会慢慢理解,水到渠成。 不过在学习的过程中,有一些概念必须要了解,有助于后续的学习与理解,需要了解的核心概念有:监督学习、无监督学习、模型、策略、算法等。 监督学习 监督学习,指的是学习的数据与后续测试的数据, ...
分类:
其他好文 时间:
2020-01-08 21:26:20
阅读次数:
120
[TOC] 统计学习 对象:data 目的:预测和分析 方法 监督,无监督,强化学习 基本分类 1. 监督学习 从标注数据中学习预测模型 建设$(X,Y)$遵循联合概率分布$P(X,Y)$, 样本独立同分布 假设空间:输入空间到输出空间映射的集合 2. 无监督 $X$是输入空间,$Z$是隐式结构空间 ...
分类:
其他好文 时间:
2020-01-05 10:13:03
阅读次数:
95
@[toc] 1 聚类的定义 聚类就是对大量未知标注的数据集,按照数据 内部存在的数据特征 将数据集划分为多个不同的类别,使类别内的数据比较相似,类别之间的数据相似度比较小;属于 无监督学习 。 聚类算法的重点是计算样本项之间的 相似度 ,有时候也称为样本间的 距离 。 和分类算法的区别: 分类算法 ...
分类:
编程语言 时间:
2020-01-04 01:38:28
阅读次数:
134
系统学习机器学习书本知识--每周两章节,列表如下: 1.模式评估与选择 线性模型 2.决策树 神经网络 3.支持向量机 贝叶斯分类器 4.集成学习 聚类 5.降维与度量学习 特征选择与稀疏学习 6.计算学习理论 半监督学习 7.概率图模型 规则学习 8.强化学习 ...
分类:
其他好文 时间:
2019-12-29 18:52:15
阅读次数:
93