算法简介 K Means是一种常用的聚类算法。聚类在机器学习分类中属于无监督学习,在数据集没有标注的情况下,便于对数据进行分群。而K Means中的K即指将数据集分成K个子集合。 K Means演示 从以下的动画、视频和计算过程可以较为直观了解算法的计算过程。 动画展示 视频展示 "https:// ...
分类:
编程语言 时间:
2019-01-28 17:47:48
阅读次数:
274
机器学习 (一) 分类 机器学习分类 机器学习分为监督学习和无监督学习两类。 监督学习是指在有标记的样本上建立机器学习的模型(这类算法知道预测什么,即目标变量的分类信息)。 无监督学习恰恰相反,是指没有标记的数据上建立学习模型。 主要任务: 分类:主要任务是将实例数据划分到合适的分类中。 回归:例如 ...
分类:
其他好文 时间:
2019-01-13 23:31:48
阅读次数:
344
一、概念 逻辑回归(Logistic Regression,LR)是一种广义的线性回归分析模型,属于监督学习算法,需要打标数据,可以用在回归、二分类和多分类等问题上,最常用的是二分类。 线性回归就是通过一条曲线区分不同的数据集,在二分类问题上会有一条直线对其进行区分,如下: 逻辑回归需要每组数据都是 ...
分类:
编程语言 时间:
2019-01-07 10:37:53
阅读次数:
189
机器学习分类:回归,分类 回归:最终得到的是在一个区间上真正(实际)的值 分类:最终得到的是个逻辑值0/1,是与不是,能与不能之类的答案名词解释: 拟合:拟合就是把平面上一系列的点,用一条光滑的曲线连接起来。因为这条曲线有无数种可能,从而有各种拟合方法。拟合的曲线一般可以用函数表示,根据这个函数的不... ...
分类:
编程语言 时间:
2019-01-04 00:24:21
阅读次数:
263
机器学习分类(1)监督学习 数据集是有标签的,就是说对于给出的样本我们是知道答案的,我们大部分学到的模型都是属于这一类的,包括线性分类器、支持向量机等等; (2)无监督学习 跟监督学习相反,数据集是完全没有标签的,主要的依据是相似的样本在数据空间中一般距离是相近的,这样就能通过距离的计算把样本分类, ...
分类:
其他好文 时间:
2018-12-21 22:56:27
阅读次数:
286
这本书的书名是故意的吧,太鸡贼了,我看到的书名是《李光耀回忆录》,实际上的书名是《李光耀回忆录 我一生的挑战:新加坡双语之路》,真正的主题是最后那一段,这个与我预期的完整人生回忆录相差甚远。 这本书的内容主要是讲新加坡怎样进行语言教育的历程,主要是英语和华语,马来语和泰米尔语只能偶尔露个头。平心而论 ...
分类:
其他好文 时间:
2018-11-29 10:59:38
阅读次数:
141
1、 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 分类与聚类:分类是一种有监督的算法,是在已经有目标分类的情况下对数据进行类别判断(朴素贝叶斯算法)。而聚类是一种无监督算法,是在建立模型之前还没有目标分类,将特征相似的数据自动聚为一类的算法(KMeans聚类算法)。 有监督学习和 ...
分类:
编程语言 时间:
2018-11-22 12:29:05
阅读次数:
187
一 朴素贝叶斯算法 1. 简介 NaïveBayes算法,又叫朴素贝叶斯算法,朴素:特征条件独立;贝叶斯:基于贝叶斯定理。属于监督学习的生成模型,实现简单,没有迭代,并有坚实的数学理论(即贝叶斯定理)作为支撑。在大量样本下会有较好的表现,不适用于输入向量的特征条件有关联的场景。 2. 基本思想 (1 ...
分类:
其他好文 时间:
2018-11-18 00:44:09
阅读次数:
342
决策树是一种很基本的分类与回归方法,但正如前面博文机器学习排序算法:RankNet to LambdaRank to LambdaMART中所讲的LambdaMART算法一样,这种最基本的算法却是很多经典、复杂、高效的机器学习算法的基础。关于什么是决策树,网上一搜就会有很多博客文章,所以本文并不想讨... ...
分类:
其他好文 时间:
2018-10-22 00:05:44
阅读次数:
290
Svm算法又称为支持向量机,是一种有监督的学习分类算法,目的是为了找到两个支持点,用来使得平面到达这两个支持点的距离最近。 通俗的说:找到一条直线,使得离该线最近的点与该线的距离最远。 我使用手写进行了推导 求解实例 软间隔,通过设置C,使得目标函数的松弛因子发生变化,松弛因子越大,表示分类越不严格 ...
分类:
编程语言 时间:
2018-10-13 22:41:10
阅读次数:
238