本文始发于个人公众号: TechFlow ,原创不易,求个关注 今天是 概率统计专题 的第六篇,我们来看看方差相关的概念。 方差的定义 方差在我们的日常生活当中非常常见,它主要是为了 提供样本离群程度的描述 。举个简单的例子,我们去买一包薯片,一般来说一袋薯片当中的数量是固定的。我们假设平均每袋当中 ...
分类:
其他好文 时间:
2020-05-16 10:59:29
阅读次数:
82
#include<stdio.h> #include<stdlib.h> //kendall相关系数 //传入两个数组,以及数组元素个数,计算这两个数组元素的Kendall相关性 double kendall(double X[],double Y[],int line) { /* int **ed ...
分类:
其他好文 时间:
2020-05-11 19:08:38
阅读次数:
66
# 重采样 多索引 标准差 协方差 import pandas as pd import numpy as np import copy # 设置列对齐 pd.set_option("display.unicode.ambiguous_as_wide",True) pd.set_option("di ...
分类:
其他好文 时间:
2020-05-07 20:08:44
阅读次数:
61
原理 求解最佳投影方向,使得同类投影点尽可能的进,异类投影点尽可能的远 同类投影点距离用同类样本协方差矩阵表示 $$ \omega^T \Sigma_i \omega \quad {第i类样本协方差}$$ 异类投影点距离 $$ ||\omega^T\mu_0 \omega^T\mu_1||_2^2$ ...
分类:
编程语言 时间:
2020-05-03 20:11:23
阅读次数:
80
一、用自己的话描述出其本身的含义: 1、特征选择 通过人工选择特征筛选删除相关系数较低的特征,从而达到降维的作用让模型更加准确。 2、PCA 分析、简化数据集,用特征降维的方法减少特征数降低数据复杂的,减少过度拟合的可能性。 二、并用自己的话阐述出两者的主要区别 特征选择后是原来的特征集;PCA选择 ...
分类:
其他好文 时间:
2020-05-03 15:01:58
阅读次数:
52
最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。 极端到极致的优美 ...
分类:
其他好文 时间:
2020-05-01 10:56:46
阅读次数:
125
表达矩阵 要做两两样本的相关性散点图,并计算标明相关系数。 编写函数要点: 直接在aes中传参是不行的 线性回归表达式 函数 方法1:用!!ensym myplot Ref: "https://stackoverflow.com/questions/15323269/addressing x and ...
分类:
其他好文 时间:
2020-04-27 17:36:05
阅读次数:
100
1 数学期望 数学期望,期望,均值 2 方差 2.1 标准差,均方差 2.2 标准化变量 重要性质 2.3 切比雪夫不等式 3 协方差与相关系数 3.1 协方差、相关系数 4 矩、协方差矩阵 4.1 原点矩、中心矩、混合矩、混合中心矩 4.2 协方差矩阵 4.2.1 二维 4.2.2 n维 ...
分类:
其他好文 时间:
2020-04-26 16:57:54
阅读次数:
69
一、用回归分析研究销售收入与广告费用支出之间的关系 为研究销售收入与广告费用支出之间的关系,医药管理部门随机抽取20家药品生产厂家,得到他们的年销售收入和广告费用支出(万元)的数据如下表所示。 我绘制了散点图以描述销售收入与广告费用之间的关系,如图所示。 (一)相关系数的显著性检验步骤 检验销售收入 ...
分类:
其他好文 时间:
2020-04-06 21:01:01
阅读次数:
357
一.主题式网络爬虫设计方案 1.主题式网络爬虫名称:国家数据网不同年份的人口比率 2.主题式网络爬虫爬取的内容:人口出生率死亡率及自然增长率 3.设计方案概述: 实现思路:爬取网站内容,之后分析提取需要的数据,进行数据清洗,之后数据可视化,并计算不同比率的相关系数 技术难点:因为用的是json分析, ...
分类:
其他好文 时间:
2020-04-05 13:55:03
阅读次数:
117