注:对于最重要的两类回归模型,之前总结了"逻辑回归"模型,这里总结一下"线性回归"模型。 0. 概述 线性回归应该是我们听过次数最多的机器学习算法了。在一般的统计学教科书中,最后都会提到这种方法。因此该算法也算是架起了数理统计与机器学习之间的桥梁。线性回归虽然常见,但是却并不简单。该算法中几乎包含了 ...
分类:
其他好文 时间:
2018-03-02 20:35:04
阅读次数:
253
1 场景解析: a.数据探查(数据量的大小,数据缺失或乱码,ETL 操作,字段类型,是否含有目标队列) b.场景抽象(是通过已有的数据,挖掘出可以应用的业务场景。机器学习主要用来解决的场景包括二分类、多分类、聚类和回归) c.算法选择(是确定算法范围、多算法尝试和多视角分析寻找最适合自身业务的算法) ...
分类:
编程语言 时间:
2018-03-01 11:46:31
阅读次数:
184
线性回归算法 解决回归问题 思想简单,容易实现 是许多强大的非线性模型的基础 结果具有很好的可解释性 蕴含机器学习中的很多重要思想 基本思想:寻找一条直线,最大程度的“拟合”样本特征和样本输出标记之间的关系 如横轴房屋面积,纵轴房屋价格 由实际值x(i)代入到拟合直线方程中得到的y_hat, 即y的 ...
分类:
其他好文 时间:
2018-02-28 17:34:38
阅读次数:
161
正规方程: 对于上面的线性回归算法我们都是采用的梯度下降法,使得损失函数最小,而对于线性回归算法还有另外一种使得损失函数最小的方法,那就是正规方程。 正规方程式通过求解下面的方程来找出使得代价函数最小的参数: ?J(θj))?θj=0 假设我们的训练集特征矩阵为X(包含x0=1)并且训练集结果为向量 ...
分类:
其他好文 时间:
2018-02-28 17:31:06
阅读次数:
203
1 回顾1.1 监督学习定义:给定正确答案的机器学习算法分类:(1)回归算法:预测连续值的输出,如房价的预测(2)分类算法:离散值的输出,如判断患病是否为某种癌症1.2 非监督学习定义:不给定数据的信息的情况下,分析数据之间的关系。聚类算法:将数据集中属性相似的数据点划分为一类。2 单变量线性回归算 ...
分类:
编程语言 时间:
2018-02-18 21:30:24
阅读次数:
181
1.什么是回归? 2.回归的类型有哪些? 3.线性回归的分析 4.总结 1.什么是回归? 回归分析是在一系列的已知或能通过获取的自变量与因变量之间的相关关系的基础上,建立变量之间的回归方程,把回归方程作为算法模型,通过其来实现对新自变量得出因变量的关系。因此回归分析是实用的预测模型或分类模型。 凡事 ...
分类:
编程语言 时间:
2018-02-14 18:19:57
阅读次数:
268
前面的文章对线性回归做了一个小结,文章在这: 线性回归原理小结。里面对线程回归的正则化也做了一个初步的介绍。提到了线程回归的L2正则化-Ridge回归,以及线程回归的L1正则化-Lasso回归。但是对于Lasso回归的解法没有提及,本文是对该文的补充和扩展。以下都用矩阵法表示,如果对于矩阵分析不熟悉 ...
分类:
编程语言 时间:
2018-02-06 23:07:54
阅读次数:
223
ng机器学习视频笔记(四) ——logistic回归 (转载请附上本文链接——linhxx) 一、概述 1、基本概念 logistic回归(logistic regression),是一个分类(classification)算法(注意不是回归算法,虽然有“回归”二字),用于处理分类问题,即结果是离散 ...
分类:
其他好文 时间:
2018-02-04 12:48:38
阅读次数:
191
回归是指利用样本(已知数据),产生拟合方程,从而对(未知数据)进行预测。 用途:预测、判别合理性。 困难:①选定变量(多元);②避免多重共线性;③观察拟合方程,避免过度拟合;④检验模型的合理性。 因变量与自变量的关系:①相关关系(非确定性关系,比如物理与化学成绩相关性),使用相关系数衡量线性相关性的 ...
分类:
编程语言 时间:
2018-01-15 22:19:13
阅读次数:
195
机器学习算法总结: 线性回归 (Linear Regression) (ML分类) Y=aX+b 利用连续性变量来估计实际数值 通过线性回归算法找出自变量和因变量间的最佳线性关系,图形上可以确定一条最佳直线 from sklearn import linear_model x_train=input ...
分类:
编程语言 时间:
2017-12-14 19:23:24
阅读次数:
247