二项分布(离散型随机变量) 如果离散型随机变量 \(X\) 的分布律为 \[ P\{X=k\}=\mathrm{C}_{n}^{k} p^{k} q^{n-k}, k=0,1, \cdots, n \] 其中 $0<p<1, q+p=1,$ 则称 \(X\) 服从二项分布,记为 \(X \sim B ...
分类:
其他好文 时间:
2020-11-07 16:07:09
阅读次数:
14
概率分布 假设每一个随机变量都符合高斯分布,那么根据已有的数据,就可以得到$\mu$ 和$\sigma$ 的估计值,从而得到其分布函数,然后就可以针对预测数据进行预测,针对多维数据,采用高维高斯分布,每一维度都是独立的,并且都符合高斯分布,计算出每一维度的高斯分布函数,可以得到多维高斯分布函数,然后 ...
分类:
其他好文 时间:
2020-09-12 21:12:57
阅读次数:
40
公式原理 对于随机变量$X$,\(Y\),协方差$COV(X,Y)=E(X-\bar)(Y-\bar)=E(XY)-EXEY$ 假设选取n个样本即,对于总体$X$的样本即为$X_1=[x_1,x_2,x_3,...]\(,均值记为\)\bar=\frac{1}\sum_i$,$Y$同上 样本方差计算 ...
分类:
其他好文 时间:
2020-09-08 20:42:48
阅读次数:
82
信息增益是树模型,比如ID3算法用来寻早最优特征分割点的计算标准了解信息增益之前, 需要了解熵 ###熵 信息增益与熵(entropy)有关,在概率论中,熵是随机变量不确定性的度量,熵越大,随机变量的不确定性就越大;假设$X$是取有限个值的离散随机变量,其概率分布为: \(P(X=x_i)=p_i, ...
分类:
其他好文 时间:
2020-08-27 17:03:55
阅读次数:
126
1 卡方分布(分布) 1.1 定义 设随机变量 X 是自由度为 n 的 χ2 随机变量, 则其概率密度函数为 表示的是一个gamma函数,它是整数k的封闭形式。gamma函数的介绍如下伽马函数的总结。 的密度函数 形状如下图 密度函数的支撑集 (即使密度函数为正的自变量的集合) 为(0, +∞), ...
分类:
其他好文 时间:
2020-07-25 09:53:47
阅读次数:
87
《R语言的科学编程与仿真》的第18章提到,所有的随机变量可以通过处理U(0,1)随机变量生成。该书在18.2里给出了一个模拟算法,具体内容摘抄如下: 假设X是在集合{0,1,...}取值的离散随机变量,累积分布函数是F,概率质量函数是p。下面一段代码给定一个均匀随机变量U并返回一个累积分布函数是F的 ...
分类:
其他好文 时间:
2020-07-14 13:47:29
阅读次数:
112
随机变量是一个对现实世界的数学建模,将文字表述的事件描述为数学代号。将特点事件的概率描述为变量的特定取值概率或取值范围概率。 **累计分布函数(cdf)**是一个特殊的概率,表示为$F_X(x)=P(X \le x)$,是单调非递减函数。 **概率密度函数(pdf)**是另一个特殊的概率,对于连续的 ...
分类:
其他好文 时间:
2020-07-11 20:56:19
阅读次数:
87
正态分布: 若随机变量x服从有个数学期望为μ,方差为σ2 的正态分布,记为N(μ,σ) 其中期望值决定密度函数的位置,标准差决定分布的幅度,当υ=0,σ=0 时的正态分布是标准正态分布 判断方法有画图/k-s检验 画图: #导入模块 import numpy as np import pandas ...
分类:
编程语言 时间:
2020-07-06 13:18:36
阅读次数:
323
总结: 1. HMM的概念: {Z}是状态序列的随机变量,{x}是观测序列的随机变量,他们是随机变量。 Q是状态集合,即气压集合(L,M,H),V是观测集合,即天气集合(S,C,W,R) I是状态序列,即气压序列(M,M,H,H,LL....),随机的但相互关联;A为转移矩阵:aij=P(it+1= ...
分类:
编程语言 时间:
2020-07-02 00:11:14
阅读次数:
82