#include<stdio.h> #include<stdlib.h> //kendall相关系数 //传入两个数组,以及数组元素个数,计算这两个数组元素的Kendall相关性 double kendall(double X[],double Y[],int line) { /* int **ed ...
分类:
其他好文 时间:
2020-05-11 19:08:38
阅读次数:
66
一、用自己的话描述出其本身的含义: 1、特征选择 通过人工选择特征筛选删除相关系数较低的特征,从而达到降维的作用让模型更加准确。 2、PCA 分析、简化数据集,用特征降维的方法减少特征数降低数据复杂的,减少过度拟合的可能性。 二、并用自己的话阐述出两者的主要区别 特征选择后是原来的特征集;PCA选择 ...
分类:
其他好文 时间:
2020-05-03 15:01:58
阅读次数:
52
最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。 极端到极致的优美 ...
分类:
其他好文 时间:
2020-05-01 10:56:46
阅读次数:
125
表达矩阵 要做两两样本的相关性散点图,并计算标明相关系数。 编写函数要点: 直接在aes中传参是不行的 线性回归表达式 函数 方法1:用!!ensym myplot Ref: "https://stackoverflow.com/questions/15323269/addressing x and ...
分类:
其他好文 时间:
2020-04-27 17:36:05
阅读次数:
100
1 数学期望 数学期望,期望,均值 2 方差 2.1 标准差,均方差 2.2 标准化变量 重要性质 2.3 切比雪夫不等式 3 协方差与相关系数 3.1 协方差、相关系数 4 矩、协方差矩阵 4.1 原点矩、中心矩、混合矩、混合中心矩 4.2 协方差矩阵 4.2.1 二维 4.2.2 n维 ...
分类:
其他好文 时间:
2020-04-26 16:57:54
阅读次数:
69
一、用回归分析研究销售收入与广告费用支出之间的关系 为研究销售收入与广告费用支出之间的关系,医药管理部门随机抽取20家药品生产厂家,得到他们的年销售收入和广告费用支出(万元)的数据如下表所示。 我绘制了散点图以描述销售收入与广告费用之间的关系,如图所示。 (一)相关系数的显著性检验步骤 检验销售收入 ...
分类:
其他好文 时间:
2020-04-06 21:01:01
阅读次数:
357
一.主题式网络爬虫设计方案 1.主题式网络爬虫名称:国家数据网不同年份的人口比率 2.主题式网络爬虫爬取的内容:人口出生率死亡率及自然增长率 3.设计方案概述: 实现思路:爬取网站内容,之后分析提取需要的数据,进行数据清洗,之后数据可视化,并计算不同比率的相关系数 技术难点:因为用的是json分析, ...
分类:
其他好文 时间:
2020-04-05 13:55:03
阅读次数:
117
参考链接:https://www.zhihu.com/question/20852004 方差: 度量单个随机变量的离散程度,公式如下: 方差表示一位数据数据的离散程度,数值越大说明离均值的差距越大,越离散 协方差: 度量两个随机变量(变化趋势)的相似程度,定义如下: 协方差表示二维数据,表示两个变 ...
分类:
其他好文 时间:
2020-03-23 23:37:05
阅读次数:
189
z-score值: (某值-mean)/标准差=z-score zi=(xi-均值)/s,zi又称为标准分数。这是统计中的标准化公式。它给出了一组数据中各个数据的相对位置。 该公式的意义: 一个数减去均值,可认为是:该数偏离均值的程度。 因为,标准差可以认为是一组数的平均离散程度。所以,减去均值后再 ...
分类:
其他好文 时间:
2020-03-21 14:33:34
阅读次数:
79
代码 1.自创数据集进行聚类 2. 相关系数 皮尔逊相关系数 斯皮尔曼相关系数 3. PCA代码 4. example 探究用户对物品类别的喜好细分降维 相关数据集联系邮箱yawei_sia@yeah.net获取 特殊知识点 K means聚类步骤 随机设置K个特征空间内的点作为初始的聚类中心 2、 ...
分类:
其他好文 时间:
2020-03-08 17:16:14
阅读次数:
62