模型选择的一些基本思想和方法0. 引言有监督学习是日常使用最多的建模范式,它有许多更具体的名字,比如预测模型、回归模型、分类模型或者分类器。这些名字或来源统计,或来源于机器学习。关于统计学习与机器学习的区别已经有不少讨论,不少人认为机器学习侧重于目标预测,而统计学习侧重于机制理解和建模。个人更加直观...
分类:
其他好文 时间:
2015-08-31 19:26:08
阅读次数:
304
在机器学习中,分类器作用是在标记好类别的训练数据基础上判断一个新的观察样本所属的类别。分类器依据学习的方式可以分为非监督学习和监督学习。非监督学习顾名思义指的是给予分类器学习的样本但没有相对应类别标签,主要是寻找未标记数据中的隐藏结构。,监督学习通过标记的训练数据推断出分类函数,分类函数可以用来.....
分类:
其他好文 时间:
2015-08-30 00:39:49
阅读次数:
169
以下的内容摘自维基百科semi-supervised learning。用来对半监督学习进行一个概念性的直观体验。
Semi-supervised learning is a class of supervised learning tasks and techniques that also make use of unlabeled data for training - typically...
分类:
其他好文 时间:
2015-08-28 15:41:53
阅读次数:
181
统计学习由监督学习(supervised learning)、非监督学习(unsupervised learning)、半监督学习(semi-supervised learning)和强化学习(reinforcement learning)组成。统计学习方法包括模型的假设空间、模型的选择准则以及模型学习的算法,称其为统计学习方法的三要素:模型(model)、策略(strategy)和算法(algor...
分类:
其他好文 时间:
2015-08-28 13:13:39
阅读次数:
151
本笔记为Coursera在线课程《Machine Learning》中的数据降维章节的笔记。十四、降维 (Dimensionality Reduction) 14.1 动机一:数据压缩本小节主要介绍第二种无监督学习方法:dimensionality reduction,从而实现数据的压缩,这样不仅可...
分类:
系统相关 时间:
2015-08-27 00:17:24
阅读次数:
370
流数据:(1)传感器数据 (2)图像、视屏数据 (3)互联网数据 (4)业务数据机器学习:(1)监督学习:给定训练集,预测测试集。训练集包括数据和响应。常见的有监督学习包括分类和回归。(2)无监督学习:该训练集中只包括特征,没有人工标注的目标。常见的务监督学习方法包括聚类和密度估计。(3)半监督学习...
分类:
其他好文 时间:
2015-08-25 18:36:37
阅读次数:
1114
最近跟完了Andrew Ng的Machine Learning前三周的课,主要讲解了机器学习中的线性回归(Linear Regression)和逻辑回归(Logistic Regression)模型。在这里做一下记录。
另外推荐一本统计学习的书,《统计学习方法》李航,书短小精悍,才200多页,但是内容基本上覆盖了机器学习中的理论基础。笔记 主要了解一下监督学习和无监督学习机器学习:是关于计算...
分类:
其他好文 时间:
2015-08-25 16:42:29
阅读次数:
240
第一周:简介机器学习,有监督学习,无监督学习。
1-1
1-2
1-3
1-4
第二周:
2-1
2-2:介绍cost function定义。
2-3:在回归函数是一个经过原点的直线的情况下,演绎cost function最小化的计算。
2-4:在回归函数是一条直线时,通过等高线演绎cost function最小化的计...
分类:
其他好文 时间:
2015-08-21 23:18:43
阅读次数:
187
1. 监督学习的一种方法学,广义线性模型(GLM)的方法学【转载时请注明来源】:http://www.cnblogs.com/aria313——根据Andrew Ng 2008年课程的第1~4节,以及相关的讲义notes 1,进行总结网易公开课地址:http://study.163.com/plan...
分类:
其他好文 时间:
2015-08-16 22:42:20
阅读次数:
295
原文:http://blog.csdn.net/suipingsp/article/details/41645779支持向量机基本上是最好的有监督学习算法,因其英文名为supportvectormachine,简称SVM。通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类...
分类:
编程语言 时间:
2015-08-16 11:59:01
阅读次数:
240