卡方分布(chi-square distribution, χ²-distribution)是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布是一种特殊的伽玛分布,是统计推断中应用最为广泛的概率分布之一,例如假设检验和置信区间的计算。若k个随机变量、……、是相互独立,符合标准正态分布的随机变量(数学期望为0、方差为1),则随机变量Z的平方和被...
分类:
其他好文 时间:
2015-04-01 17:54:00
阅读次数:
496
开博第三篇依旧回顾下数据分析涉及到的统计学中最基本的概念,包含了以下几个概念:标准差,标准误。10 标准差在概率论和数理统计中,标准差(Standard Deviation,符号\(\sigma\))是方差的算术平方根。标准差定义是总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个...
分类:
其他好文 时间:
2015-03-30 23:03:39
阅读次数:
252
开博第二篇依旧回顾下数据分析涉及到的统计学中最基本的概念,包含了以下几个概念:期望,方差,标准差,离差,残差,协方差。0 离散性随机变量,连续性随机变量随机变量(random variable)表示随机试验各种结果的实值单值函数。例如某一时间内公共汽车站等车乘客人数,每次投掷骰子出现的点数等,都是随...
分类:
其他好文 时间:
2015-03-30 21:06:49
阅读次数:
1823
快排我接触的也比较多了,从之前NOIP的时候算法老师讲的版本,到之前数据结构课上学习的版本,到现在《算法导论》里讲的版本,我个人并不能不能区别它们的好坏,权且都写出来,以后再来区别。三种实现方式如下:noip:void qsort1(int *a,int l,int r){ int i,j...
分类:
编程语言 时间:
2015-03-22 10:35:41
阅读次数:
218
也有好几天没记录算法学习情况了,这两天看了《算法导论》的第二部分,排序和顺序统计学,记录一下,也顺便增强记忆1.堆排序 就是最大堆和最小堆,用一维数组存储,数据结构是完全二叉树。主要过程分为构建最大/最小堆,插入操作,弹出最大值,取最大/最小值,改变堆中的权值。 构建堆就是从第一个非叶子节点...
分类:
编程语言 时间:
2015-03-21 22:50:14
阅读次数:
215
在机器学习-李航-统计学习方法学习笔记之感知机(1)中我们已经知道感知机的建模和其几何意义。相关推导也做了明确的推导。有了数学建模。我们要对模型进行计算。 感知机学习的目的是求的是一个能将正实例和负实例完全分开的分离超平面。也就是去求感知机模型中的参数w和b.学习策略也就是求解途径就是定义...
分类:
其他好文 时间:
2015-03-19 23:47:25
阅读次数:
1014
感知机是古老的统计学习方法,主要应用于二类线性可分数据,策略是在给定的超平面上对误差点进行纠正,从而保证所有的点都是正确可分的。用到的方法是随机梯度下降法,由于是线性可分的,可保证最终在有限步内收敛。具体可参考李航的《统计学习方法》#include#include#include#includeus...
分类:
编程语言 时间:
2015-03-17 23:16:25
阅读次数:
244
感知机应该是机器学习里面最简单的模型了。读一遍文章也能理解作者想表达的意思。因为以前像梯度下降,多项式拟合,神经网络都在Andrew Ng的公开课上看过了。但是真正关于书中的公式却不怎么理解。一些简单的作者也没有推导。毕竟这是机器学习,不是微积分,或者线性代数,或者概率论。微积分,概率论,...
分类:
其他好文 时间:
2015-03-17 21:34:04
阅读次数:
296
2.3两种简单的预测方法:最小二乘和最近邻
在本节中我们详细讨论两种简单但有效的预测方法,使用最小二乘线性模型拟合和k最近邻预测。线性模型对结构做了大量的假设,但是可能会产生不准确的预测。K-最近邻对结构做了适当的假设,所以预测通常是精确但不稳定的。
2.3.1线性模型和最小二乘
在过去的30年中,线性模型一直是统计学的支柱,而且现在依然是我们最重要的工具之...
分类:
其他好文 时间:
2015-03-15 13:57:03
阅读次数:
161
最近在学机器学习,看了Andrew Ng 的公开课,同时学习李航博士的 《统计学习方法》在此记录。在第十二页有一个关于多项式拟合的问题。此处,作者直接给出了所求的的偏导。这里做一下详细推导。 ,此处函数模型的求偏导问题,首先看一下偏导的定义因为此处是,所以除了Wj 外的Xi,Yi 都可以视...
分类:
其他好文 时间:
2015-03-14 06:08:31
阅读次数:
258