1、What is a Chi Square Test? 卡方检验有两种类型。两者使用卡方统计量和分布的目的不同。 第一种:卡方拟合优度检验确定样本数据是否与总体匹配。(这里不介绍) 第二种:独立性的卡方检验比较列联表中的两个变量,看看它们是否相关。在更一般的意义上,它测试分类变量的分布是否不同。 ...
分类:
其他好文 时间:
2019-01-01 17:17:39
阅读次数:
169
title: sklearn 特征工程之特征选择 date: 2016 11 25 22:49:24 categories: skearn tags: sklearn 抄袭/参考资料 "使用sklearn做单机特征工程" "sckearn中文" 周志华《机器学习》 当数据预处理完成后,我们需要选择有 ...
分类:
其他好文 时间:
2018-12-01 18:23:12
阅读次数:
400
内容简介 · · · · · · 本书以小说的形式展开,讲述了主人公俵太从大学文科专业毕业后进入征信所,从零开始学习数据分析的故事。书中以主人公就职的征信所所在的商业街为舞台,选取贴近生活的案例,将平均值、t检验、卡方检验、相关、回归分析、文本挖掘以及时间序列分析等数据分析的基础知识融入到了生动有趣 ...
分类:
其他好文 时间:
2018-10-07 14:40:36
阅读次数:
180
卡方分布—chi-square distribution, χ2-distribution: 若k个独立的随机变量Z1, Z2,..., Zk 满足标准正态分布 N(0,1) , 则这k个随机变量的平方和: 为服从自由度为k的卡方分布,记作: 或者 卡方检验—χ2检验是以χ2分布为基础的一种假设检验 ...
分类:
其他好文 时间:
2018-09-14 23:13:21
阅读次数:
480
1 抽象成数学问题明确问题是进行机器学习的第一步。机器学习的训练过程通常都是一件非常耗时的事情,胡乱尝试时间成本是非常高的。这里的抽象成数学问题,指的我们明确我们可以获得什么样的数据,目标是一个分类还是回归或者是聚类的问题,如果都不是的话,如果划归为其中的某类问题。2 获取数据数据决定了机器学习结果 ...
分类:
其他好文 时间:
2018-09-04 16:54:24
阅读次数:
342
一、卡方分布 若k个独立的随机变量Z1,Z2,?,Zk,且符合标准正态分布N(0,1),则这k个随机变量的平方和,为服从自由度为k的卡方分布。 卡方分布之所以经常被利用到,是因为对符合正态分布的随机变量的处理过程中,很容易出现其平方和的统计量。 正如在卡方检验问题中出现这个统计量一样自然。 二、卡方 ...
分类:
其他好文 时间:
2018-03-18 17:13:58
阅读次数:
406
特征选择的一般过程 从特征全集中产生出一个特征子集,然后用评价函数对该特征子集进行评价,评价的结果与停止准则进行比较,若满足停止准则就停止,否则就继续产生下一组特征子集,继续进行特征选择。 特征子集产生过程( Generation Procedure ) 采取一定的子集选取办法,为评价函数提供特征子 ...
分类:
编程语言 时间:
2018-02-12 15:16:46
阅读次数:
203
卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。(更多参考:卡方检验、卡方分布) 不讲过多理论,主要使用 python 实现卡方验证。之前 ...
分类:
编程语言 时间:
2018-01-14 11:08:46
阅读次数:
2184
Two-sample t test power calculation n = 33.82555 #样本大小 d = 0.8 #效应值,标准化的均值之差 sig.level = 0.05 #显著水平 power = 0.9 #功效水平,多少把握成功测量出效果 alternative = two.si ...
分类:
编程语言 时间:
2017-10-26 13:25:11
阅读次数:
204
卡方检验的思想和实现 作者:李雪丽 材料摘自:百度 ...
分类:
编程语言 时间:
2017-05-30 19:31:37
阅读次数:
111