码迷,mamicode.com
首页 > 其他好文 > 详细

深入浅出统计学01

时间:2020-07-15 23:33:36      阅读:76      评论:0      收藏:0      [点我收藏+]

标签:宽度   构建   相关   总结   数值范围   变异   集中   坐标   包括   

深入浅出统计学

框架

  1. 第一印象
  2. 集中趋势的度量
  3. 分散性与变异度的度量
  4. 概率计算
  5. 离散概率分布的运用
  6. 排列与组合
  7. 几何分布、二项分布及泊松分布
  8. 正态分布的运用
  9. 再谈正态分布的运用
  10. 统计抽样的运用
  11. 总体和样本的估计
  12. 置信区间的构建
  13. 假设检验的运用
  14. x^2分布
  15. 相关与回归

01 第一印象

基本概念

  1. 频数:频数是一种统计方法,用来描述一个类别中有多少个项。
  2. 频数密度:长方形高度用于度量一个特定组的频数的集中程度,是对频数密集度的一种度量,是用于说明数字到底是“稠密”还是“稀薄”的一种方法。长方形的高度称为频数密度。
  3. 累积频数:累加到某个特定数值为止的总频数。即频数的累计总和。通过累计频数可知到该数值点为止的总频数。例如,假设你有一些人的年龄数据。数值27的累积频数表示到27岁(包括27岁在内)为止的人有多少。

图形种类

  1. 饼图
  2. 条形图 - 条形图中的每一个长方形代表一个特定类,长方形的长度代表某种数值。长方形越长,数值越大。所有长方形的宽度都相等。
    1. 垂直条形图
    1. 水平条形图

标度

  1. 百分数标度
  2. 频数标度

处理多批数据

  1. 堆积条形图
  2. 分段条形图

数据的分类

  1. 类别数据(定性数据)
  2. 数据值数据(定量数据)

直方图和条形图的区别

    1. 每个长方形的面积与频数成正比
    1. 图上的长方形之间没有间隔

绘制区间相同的直方图

  • 查看每个区间,求出每个区间的宽度,以及每个区间涵盖的数据范围。同时要确保直方图的各个长方形之间没有间隔。
  • 为了保证各个长方形之间没有间隔,要适当的扩大第一个区间的结束范围,减少第二个区间的开始范围,从而形成一条唯一边界(一般是从中间会合)。扩大和缩小的点,对应的另一个端点也要一起调整从而保证区间范围不变。
  • 比如(0-99)、(200-399)在直方图中要用(-0.5-199.5)、(199.5-399.5)表示。

绘制区间不相等的直方图

  1. 求长方形的宽度 - 长方形所覆盖的数值范围就是长方形的宽度。
  2. 求长方形的高度
    1. 长方形面积 = 每组频数
    1. 长方形高度 = 频数 / 长方形宽度
长方形高度用于度量一个特定组的频数的集中程度,是对频数密集度的一种度量,是用于说明数字到底是“稠密”还是“稀薄”的一种方法。长方形的高度称为频数密度。
  1. 画出直方图
  • 纵坐标为频数密度

累计频数图(折线图)

累积频数:累加到某个特定数值为止的总频数。即频数的累计总和。通过累计频数可知到该数值点为止的总频数。例如,假设你有一些人的年龄数据。数值27的累积频数表示到27岁(包括27岁在内)为止的人有多少。

总结

  • 使用哪种图形归根结底在于你要传递的信息,以及你要提炼的主要事实。

深入浅出统计学01

标签:宽度   构建   相关   总结   数值范围   变异   集中   坐标   包括   

原文地址:https://www.cnblogs.com/xiaoheng2020/p/13307025.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!