声明: 1。本篇为个人对《2012.李航.统计学习方法.pdf》的学习总结,不得用作商用。欢迎转载,但请注明出处(即:本帖地址)。 2,因为本人在学习初始时有非常多数学知识都已忘记,因此为了弄懂当中的内容查阅了非常多资料,所以里面应该会有引用其它帖子的小部分内容。假设原作者看到能够私信我,我会将您的 ...
分类:
编程语言 时间:
2017-08-20 14:07:09
阅读次数:
241
1. 什么是统计学习? 统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。具有以下特点: (1)以计算机和网络为平台;(2)以数据为对象,数据驱动的学科;(3)目的是对数据进行预测和分析;(4)以方法为中心,统计学习方法 ...
分类:
其他好文 时间:
2017-08-19 15:54:39
阅读次数:
206
最近学习基础算法《统计学习方法》,看到利用EM算法估计高斯混合模型(GMM)的时候,发现利用贝叶斯的来理解高斯混合模型的应用其实非常合适。 首先,假设我们对于贝叶斯比较熟悉,对高斯分布也熟悉。本文将GMM用于聚类来举例。 除了简单的高斯分布,理论上通过组合多个不同的高斯分布可以构成任意复杂的分布函数 ...
分类:
其他好文 时间:
2017-08-09 16:49:39
阅读次数:
221
1、定义: 生成模型(或称产生式模型)和判别模型(或称判别式模型)的本质区别在于模型中观测序列x和状态序列y的决定关系。前者假设y决定x,后者假设x决定y。 2、生成模型特点 2.1、生成模型以“状态序列y按照一定的规律生成观察输入序列x”为假设,针对联合分布p(x,y)建模,通过估计生成概率最大的 ...
分类:
其他好文 时间:
2017-08-06 11:03:22
阅读次数:
196
一、K近邻算法 k近邻法(k-nearest neighbor,k-NN)是一种基本分类与回归方法,输入实例的特征向量,输出实例的类别,其中类别可取多类 二、k近邻模型 2.1 距离度量 距离定义: (1)当p=1,称为曼哈顿距离 (2)当p=2,称为欧式距离 (3)当p取无穷大时,它是各个坐标距离 ...
分类:
编程语言 时间:
2017-07-30 20:07:30
阅读次数:
247
统计学习:scikit学习中的设置和估计对象 数据集 Scikit学习处理来自以2D数组表示的一个或多个数据集的学习信息。它们可以被理解为多维观察的列表。我们说这些阵列的第一个轴是样本轴,而第二个轴是 特征轴。 scikit:iris数据集附带的一个简单示例 >>> >>> from sklearn ...
分类:
其他好文 时间:
2017-07-26 18:13:00
阅读次数:
276
《机器学习》 --周志华版(西瓜书)--课后参考答案 对机器学习一直很感兴趣,也曾阅读过李航老师的《统计学习导论》和Springer的《统计学习导论-基于R应用》等相关书籍,但总感觉自己缺乏深入的理解和系统的实践。最近从实验室角落觅得南京大学周志华老师《机器学习》一书,随意翻看之间便被本书内容文笔深 ...
分类:
其他好文 时间:
2017-07-25 13:32:58
阅读次数:
133
声明: 1,本篇为个人对《2012.李航.统计学习方法.pdf》的学习总结,不得用作商用。欢迎转载。但请注明出处(即:本帖地址)。 2,因为本人在学习初始时有非常多数学知识都已忘记,因此为了弄懂当中的内容查阅了非常多资料。所以里面应该会有引用其它帖子的小部分内容。假设原作者看到能够私信我。我会将您的 ...
分类:
其他好文 时间:
2017-07-22 14:42:14
阅读次数:
229
过拟合 在进行数据挖掘或者机器学习模型建立的时候,因为在统计学习中,假设数据满足独立同分布,即当前已产生的数据可以对未来的数据进行推测与模拟,因此都是使用历史数据建立模型,即使用已经产生的数据去训练,然后使用该模型去拟合未来的数据。但是一般独立同分布的假设往往不成立,即数据的分布可能会发生变化(di ...
分类:
其他好文 时间:
2017-07-22 12:05:06
阅读次数:
179
声明: 1,本篇为个人对《2012.李航.统计学习方法.pdf》的学习总结,不得用作商用,欢迎转载,但请注明出处(即:本帖地址)。 2,因为本人在学习初始时有非常多数学知识都已忘记,所以为了弄懂当中的内容查阅了非常多资料,所以里面应该会有引用其它帖子的小部分内容。假设原作者看到能够私信我。我会将您的 ...
分类:
其他好文 时间:
2017-07-20 20:58:53
阅读次数:
138