Some further statements on KNN:
It
appears that k-nearest-neighbor fits have a single parameter, the number of neighbors k, compared to the p parameters in least-squares fits. Although this is the...
分类:
其他好文 时间:
2016-04-01 18:33:09
阅读次数:
516
本笔记为Coursera在线课程《Machine Learning》中的单变量线性回归章节的笔记。
2.1 模型表示
参考视频: 2 - 1 - Model Representation (8 min).mkv
本课程讲解的第一个算法为"回归算法",本节将要讲解到底什么是Model。下面,以一个房屋交易问题为例开始讲解,如下图所示(从中可以看到监督学习的基本流程)。
所使用的数据集为...
分类:
系统相关 时间:
2016-04-01 18:22:42
阅读次数:
210
本笔记为Coursera在线课程《Machine Learning》中的数据降维章节的笔记。
十四、降维 (Dimensionality Reduction)
14.1 动机一:数据压缩
本小节主要介绍第二种无监督学习方法:dimensionality reduction,从而实现数据的压缩,这样不仅可以减少数据所占磁盘空间,还可以提高程序的运行速度。如下图所示的例子,假设有一个具有很多维...
分类:
系统相关 时间:
2016-04-01 18:17:59
阅读次数:
308
Introduction在数据集中有一系列变量作为输入,这些输入变量也就是我们提前测量得到的数据。它们对某个或某些输出产生影响。简言之,就是利用输入来预测输出。形如这种形式的学习形式称之为监督学习。术语:(在不同的领域)
输入-预测因子-自变量-特征
输出-因变量-响应Variable Types and Terminology在不同的例子中输出不同。在葡萄糖预测的例子中,输出是定量的指标,有些...
分类:
其他好文 时间:
2016-03-31 11:07:25
阅读次数:
302
1、Model representation 首先来看一个简单的学习算法—线性回归,通过对线性回归模型的分析可以了解有监督学习算法的过程。 先看一个房价预测的问题,我们利用一个城市的房价信息集,来预测房屋价格和房屋面积的关系。 根据图中信息,我们如何预测面积为1250的房屋的销售价格?很直接的方法就 ...
分类:
其他好文 时间:
2016-03-30 19:40:28
阅读次数:
143
9 Anomaly Detection9.1 Density Estimation9.1.1 Problem Motivation异常检测(Density Estimation)是机器学习常见的应用,主要用于非监督学习,但在某些方面又类似于监督学习。异常检测最常见的应用是欺诈检测和在工业生产领域。 ...
分类:
其他好文 时间:
2016-03-29 10:18:23
阅读次数:
390
1. 监督学习(supervised learning): 给定输入样本集,机器可以从中推演出指定目标的可能结果。 一般采用两种类型的目标变量:标称型和数值型。 - 标称型:标称型目标变量的结果只有在有限目标集中取值,如真与假,动物分类集合 {爬行类,鱼类, 哺乳类,两栖类} - 数值型:数值型目标 ...
分类:
其他好文 时间:
2016-03-24 12:52:21
阅读次数:
139
概述 以监督学习为例,假设我们有训练样本集 ,那么神经网络算法能够提供一种复杂且非线性的假设模型 ,它具有参数 ,可以以此参数来拟合我们的数据。 为了描述神经网络,我们先从最简单的神经网络讲起,这个神经网络仅由一个“神经元”构成,以下即是这个“神经元”的图示: 这个“神经元”是一个以 及截距 为输入
分类:
其他好文 时间:
2016-03-12 21:25:31
阅读次数:
226
二. 最小二乘法 我们以最简单的一元线性模型来解释最小二乘法。什么是一元线性模型呢? 监督学习中,如果预测的变量是离散的,我们称其为分类(如决策树,支持向量机 等),如果预测的变量是连续的,我们称其为回归。回归分析中,如果只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称
分类:
其他好文 时间:
2016-03-03 13:02:36
阅读次数:
137
?? 内容概要 怎样使用pandas读入数据怎样使用seaborn进行数据的可视化scikit-learn的线性回归模型和用法线性回归模型的评估測度特征选择的方法 作为有监督学习,分类问题是预測类别结果,而回归问题是预測一个连续的结果。 1. 使用pandas来读取数据 Pandas是一个用于数据探
分类:
其他好文 时间:
2016-02-25 09:08:08
阅读次数:
578