标签:img 合并 还需 err 如何 函数 分布 直方图 erro
在上一篇文章中我们简单给大家介绍了数据分析工作中的数据获取以及数据提取,这两个步骤是十分重要的。要知道,数据分析就是分析数据,我们只有获取了数据才能够做好数据分析工作。但是我们提取了数据还是需要进一步整理的,下面我们就给大家讲解一下数据分析中后续步骤。
当我们获取了数据之后,我们需要做数据预处理工作。很多时候我们拿到的数据是不干净的,数据的重复、缺失、异常值等等,这时候就需要进行数据的清洗,把这些影响分析的数据处理好,才能获得更加精确地分析结果。那么我们需要用相应的方法去处理,比如残缺数据,我们是直接去掉这条数据,还是用临近的值去补全,这些都是需要考虑的问题。而对于数据预处理需要我们掌握的知识点有很多,比如数据访问、对缺失数据行进行删除或填充、重复值的判断与删除、清除不必要的空格和极端、异常数据、描述性统计、Apply、直方图等、符合各种逻辑关系的合并操作、数据划分、分别执行函数、数据重组等知识。
除了学习上面提到的知识以外,我们还需要学习概率论及统计学知识。我们学会了概率论与统计学知识以后,我们就知道了数据整体分布是怎样的?什么是总体和样本?中位数、众数、均值、方差等基本的统计量如何应用?如何在不同的场景中做假设检验?数据分析方法大多源于统计学的概念,所以统计学的知识也是必不可少的。需要掌握的知识点有很多,比如基本统计量:均值、中位数、众数、百分位数、极值等、其他描述性统计量:偏度、方差、标准差、显著性等、其他统计知识:总体和样本、参数和统计量、ErrorBar、概率分布与假设检验:各种分布、假设检验流程、其他概率论知识:条件概率、贝叶斯等。有了统计学的基本知识,你就可以用这些统计量做基本的分析了。通过可视化的方式来描述数据的指标,其实可以得出很多结论。
以上的内容就是小编为大家介绍的数据分析内容中的数据预处理以及统计学方面需要学习的知识点了,大家在进行学习数据分析的时候还是需要注重上面提到的知识点,这样才能够做好数据分析工作,我们会在下一篇文章中给大家说一下数据分析中的其他知识。最后感谢大家的阅读。
标签:img 合并 还需 err 如何 函数 分布 直方图 erro
原文地址:https://www.cnblogs.com/CDA-JG/p/10185426.html