房价预测 是我入门Kaggle的第二个比赛,参考学习了他人的一篇优秀教程:https://www.kaggle.com/serigne/stacked regressions top 4 on leaderboard 通过 Serigne 的这篇notebook,我学习到了关于数据分析、特征工程、集 ...
分类:
其他好文 时间:
2019-08-21 18:58:06
阅读次数:
120
逻辑斯蒂回归主要用于二分类,推广到多分类的话是类似于softmax分类。求 上述问题可以通过最大化似然函数求解。 上述问题可以采用最小化logloss进行求解。 一般地,我们还需要给目标函数加上正则项,参数w加上l1或者l2范数。 LR适合大规模数据,数据量太小的话可能会欠拟合(考虑到数据通常比较稀 ...
分类:
其他好文 时间:
2019-08-18 17:52:13
阅读次数:
157
多项式回归 [TOC] 直线回归研究的是一个依变量与一个自变量之间的回归问题。 研究一个因变量与一个或多个自变量间多项式的回归分析方法,称为多项式回归(Polynomial Regression)多项式回归模型是线性回归模型的一种。 多项式回归问题可以通过变量转换化为多元线性回归问题来解决。 一、多 ...
分类:
其他好文 时间:
2019-08-11 00:25:05
阅读次数:
91
今日学习打卡,logistic regression 这个概念来自于统计学,也可用于机器学习,可用于2项分类(0,1),也可以多项分类(0,1,2,...)。 线性回归,一般用R2来作为检测模型好坏的指标。 logistic regression则是用likelihood,计算每个值的likelih ...
分类:
其他好文 时间:
2019-07-29 14:28:11
阅读次数:
98
一、多元回归分析简介 用回归方程定量地刻画一个应变量与多个自变量间的线性依存关系,称为多元回归分析(multiple linear regression),简称多元回归(multiple regression)。 多元回归分析是多变量分析的基础,也是理解监督类分析方法的入口!实际上大部分学习统计分析 ...
分类:
其他好文 时间:
2019-07-28 22:48:10
阅读次数:
234
Logistic Regression [TOC] 模型介绍 ? 逻辑回归作为一个判别模型,其形式如下: $$ p(y=1\vert \mathbf x)=Ber\left(y\vert \text{sigm}\left(\mathbf w^T\mathbf x\right)\right) $$ 参 ...
分类:
其他好文 时间:
2019-07-20 09:23:02
阅读次数:
97
1、线性回归 假设线性函数如下: 假设我们有10个样本x1,y1),(x2,y2).....(x10,y10),求解目标就是根据多个样本求解theta0和theta1的最优值。 为了解决这个问题,我们需要引入误差分析预测值与真实值之间的误差为最小。 2、梯度下降算法 梯度下降的场景: 梯度下降法的基 ...
分类:
编程语言 时间:
2019-07-17 18:38:52
阅读次数:
175
1.为什么不用Regression? 用Regression显然会得到紫色线,而不是绿线 2.定义Loss Function 即分类不正确的样本个数 3.求每个元素在某个类别的概率 p(class1|x) = p(x|class1)p(class1) / [p(x|class1)p(class1) ...
分类:
其他好文 时间:
2019-07-12 14:25:07
阅读次数:
86
Sklearn简介 Scikit-learn(sklearn)是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装,包括回归(Regression)、降维(Dimensionality Reduction)、分类(Classfication)、聚类(Clustering)等方法。当我们面临机 ...
分类:
编程语言 时间:
2019-07-01 13:51:44
阅读次数:
140
在《机器学习 逻辑回归(一)(Machine Learning Logistic Regression I)》一文中,我们讨论了如何用逻辑回归解决二分类问题以及逻辑回归算法的本质。现在来看一下多分类的情况。 现实中相对于二分类问题,我们更常遇到的是多分类问题。多分类问题如何求解呢?有两种方式。一种是 ...
分类:
系统相关 时间:
2019-06-23 20:48:12
阅读次数:
170