1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归(Logistic Regression)是用于处理因变量为分类变量的回归问题,常见的是二分类或二项分布问题,也可以处理多分类问题,它实际上是属于一种分类方法。 区别线性回归假设响应变量服从正态分布,逻辑回归假设响应变量服 ...
分类:
其他好文 时间:
2020-04-24 22:14:43
阅读次数:
87
1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 2.自述一下什么是过拟合和欠拟合? 3.思考一下逻辑回归的应用场景有哪些? 1.逻辑回归:逻辑回归是一种用于解决二分类问题的机器学习方法,用于估计某种事物的可能性。 线性回归 逻辑回归 要求变量服从正态分布 对变量分布没有要求 要 ...
分类:
其他好文 时间:
2020-04-23 21:16:51
阅读次数:
57
前言 简介 本文是对概率论中常见分布包括二项分布、0-1分布、泊松分布、均匀分布、正态分布、指数分布的期望和方差的证明整合,附加自己的推导或理解。 前言 简介 本文是对概率论中常见分布包括二项分布、0-1分布、泊松分布、均匀分布、正态分布、指数分布的期望和方差的证明整合,附加自己的推导或理解。 导览 ...
分类:
其他好文 时间:
2020-04-20 21:55:45
阅读次数:
120
在做数据分析或者统计的时候,经常需要进行数据正态性的检验,因为很多假设都是基于正态分布的基础之上的,例如:T检验。 在Python中,主要有以下检验正态性的方法: 1. scipy.stats.shapiro —— Shapiro-Wilk test,属于专门用来做正态性检验的模块,其原假设:样本数 ...
分类:
编程语言 时间:
2020-04-15 21:30:51
阅读次数:
144
百度百科的定义如下 参阅Wikipedia举例,下图中,X和Y遵从绿圈内所示的二元正态分布,红线和蓝线分别表示Y变量和X变量的边缘分布 ...
分类:
其他好文 时间:
2020-04-07 22:18:24
阅读次数:
92
前言 撒豆实验 抛硬币实验 古典+几何 频率概率 求圆周率 树状图 列表法 几何概型1 正态分布 计票统计 ...
分类:
其他好文 时间:
2020-04-05 15:36:27
阅读次数:
77
首先,了解几个相关概念。 频数:在一组样本数据中,不同的数据出现的次数有多有少,或者说它们出现的频繁程度不同,我们称每个数据出现的次数为频数。 频率:每个数据出现的次数与样本数据总量的比值为频率。 组数:把全体样本数据分成的组的个数(当数据总量在100个以内时,常常分为5~12组)。 组距:把全体样 ...
分类:
其他好文 时间:
2020-04-04 21:04:47
阅读次数:
171
一、多元线性回归模型 1.多元线性回归模型的一般形式: 2.总体回归函数的非随机表达式-均值的回归模型,则去掉了误差项: 3.解释变量: 4.多元线性回归模型的矩阵表达形式: n为样本下标,k+1为解释变量下标,必须是Xβ,不能反过来,矩阵相乘必须是左矩阵的列等于右矩阵的行。 5.样本回归函数: 二 ...
分类:
其他好文 时间:
2020-04-04 19:02:00
阅读次数:
220
在上一篇博客中我们介绍并实现了自动编码器,本文将用PyTorch实现变分自动编码器(Variational AutoEncoder, VAE)。自动变分编码器原理与一般的自动编码器的区别在于需要在编码过程增加一点限制,迫使它生成的隐含向量能够粗略的遵循标准正态分布。这样一来,当需要生成一张新图片时, ...
分类:
其他好文 时间:
2020-03-30 23:49:45
阅读次数:
281
Task3特征工程 常见的特征工程包括: 异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断; 特征归一化/标准化: 标准化(转换为标准正态分布); 归一化(抓换到 [0,1] 区间); 针对幂律分布,可以采用公式: log(1+x1+me ...
分类:
其他好文 时间:
2020-03-28 23:48:19
阅读次数:
127