专有名词 机器学习 (machine learning) 预测分析 (predictive analytics) 统计学习 (statistical learning) 监督学习 (supervised learning) 无监督学习 (unsupervised learning) 样本 (samp ...
分类:
编程语言 时间:
2020-05-30 21:59:46
阅读次数:
75
直方图概述 简单来说,直方图就是对数据进行统计的一种方法,这些数据可以是梯度、方向、色彩或任何其他特征。它的表现形式是一种二维统计表,横纵坐标分别是统计样本和该样本对应的某个属性的度量。 计算直方图:calcHist 函数 calcHist 函数用于计算一个或多个阵列的直方图。 void calcH ...
分类:
其他好文 时间:
2020-02-28 18:39:46
阅读次数:
129
【推断统计】 1. 样本和总体 总体:目标事件的全体 样本:总体的一部分(总体的子集) 2. 推断统计: 用样本数据对总体进行归纳的统计过程 假定:样本对总体具有代表性 3. 假设检验: 两个假设:原假设+备择假设 原假设:表述为一个处理没有影响--(小概率事件)H0 备择假设:表述为该处理有影响 ...
分类:
其他好文 时间:
2020-01-24 00:04:33
阅读次数:
351
通过两组统计数据计算而得的协方差可以评估这两组统计数据的相似程度。 样本: 平均值: 离差(用样本中的每一个元素减去平均数,求得数据的误差程度): 协方差 协方差可以简单反映两组统计样本的相关性,值为正,则为正相关;值为负,则为负相关,绝对值越大相关性越强。 案例:计算两组数据的协方差,并绘图观察。 ...
分类:
其他好文 时间:
2019-09-05 15:20:42
阅读次数:
117
机器学习是时下流行AI技术中一个很重要的方向,无论是有监督学习还是无监督学习都使用各种“度量”来得到不同样本数据的差异度或者不同样本数据的相似度。良好的“度量”可以显著提高算法的分类或预测的准确率,本文中将介绍机器学习中各种“度 ...
分类:
其他好文 时间:
2019-06-15 18:56:51
阅读次数:
115
深度学习的数学基础 微积分 无穷小在17世纪下半叶,数学史上出现了无穷小的概念,而后发展处极限的概念 极限 数列的极限 函数的极限 导数 微分 积分 不定积分也称为原函数或反导数 定积分 定积分中值定理 牛顿-莱布尼茨公式 偏导数 概率统计 样本空间定义:随机试验 E 的所有结果构成的集合称为 E ...
分类:
其他好文 时间:
2019-01-02 10:46:15
阅读次数:
200
·统计样本周边的密度,把密度给定一个阈值,不断的把样本添加到最近的簇。例如:人口密度,根据密度,聚类出城市 ·解决类似圆形的K-Means聚类的特点;密度聚类缺点:计算复杂度大,空间索引来降低计算时间,降低查找速度。 (DBSCAN算法): 参数:DBSCAN(eps=0.5, min_sample ...
分类:
其他好文 时间:
2018-12-12 19:05:03
阅读次数:
426
一、SPSS SPSS(Statistical Product and Service Solutions),"统计产品与服务解决方案"软件。最初软件全称为"社会科学统计软件包"(SolutionsStatistical Package for the Social Sciences),但是随着SP ...
分类:
其他好文 时间:
2017-11-05 12:16:53
阅读次数:
178
支持向量机 1 概念 支持向量机是一种分类方法,通过寻求结构化、风险最小,来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较小的情况下,亦能获得良好统计规律的目的。通俗来讲,他是一种二类分类模型,基本模型定义为特征空间上的间隔最大的线性分类器,即支持向量机的学习策略便是间隔... ...
分类:
其他好文 时间:
2017-09-30 13:10:47
阅读次数:
196
卡方检验是基于卡方分布的一种检验方法,属于非参数检验,它统计样本的实际观测值与理论推断值之间的偏离程度,以此计算统计量χ2,χ2越大,二者偏差越大;卡方值越小,二者偏差越小,若两个值完全相等时,χ2值就为0,表明实测值与理论值完全吻合。 很多文献资料中都注明卡方检验适用于分类变量,而一提到分类变量的 ...
分类:
其他好文 时间:
2017-03-29 20:50:47
阅读次数:
1948