码迷,mamicode.com
首页 > 编程语言 > 详细

Python数据分析初始(一)

时间:2017-03-05 23:01:42      阅读:217      评论:0      收藏:0      [点我收藏+]

标签:方便   图像处理   下载   示例   win   matlab   模块   工具包   span   

基础库

pandas:python的一个数据分析库(pip install pandas)

seaborn:数据可视化 (pip install seaborn)

scipy:数值计算库(pip install scipy)

  • SciPy (pronounced "Sigh Pie") 是一个开源的数学、科学和工程计算包。它是一款方便、易于使用、专为科学和工程设计的Python工具包,包括统计、优化、整合、线性代数模块、傅里叶变换、信号和图像处理、常微分方程求解器等等。

matplotlib:数据可视化 (pip install matplotlib)

  • Matplotlib是一个Python的图形框架,类似于MATLAB和R语言。它是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。

sklearn:建模,科学计算库(pip install scikit-learn)

  • Scikit-Learn是基于python的机器学习模块,基于BSD开源许可。Scikit-learn的基本功能主要被分为六个部分,分类,回归,聚类,数据降维,模型选择,数据预处理。

numpy:线性代数、向量矩阵等,科学运算库(pip install numpy)

  • NumPy(Numeric Python)系统是Python的一种开源的数值计算扩展,一个用python实现的科学计算包。它提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库。专为进行严格的数字处理而产生。内容包括:1、一个强大的N维数组对象Array;2、比较成熟的(广播)函数库;3、用于整合C/C++和Fortran代码的工具包;4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy配合使用更加方便。

Windows环境可以到 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载安装

 

 

工具

ipython notebooks:Python做教学、计算、科研的一个重要工具

pip install ipython
pip install "ipython[notebook]"

访问命令:ipython notebook

 

四分位数

四分位数(Quartile),即统计学中,把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。

示例:

首先确定四分位数的位置:(n表示项数)

  • Q1的位置= (n+1) × 0.25
  • Q2的位置= (n+1) × 0.5
  • Q3的位置= (n+1) × 0.75

对于四分位数的确定,有不同的方法,另外一种方法基于N-1 基础。即

  • Q1的位置=1+(n-1)x 0.25
  • Q2的位置=1+(n-1)x 0.5
  • Q3的位置=1+(n-1)x 0.75

Excel 中有两个四分位数的函数。QUARTILE.EXC 和QUARTILE.INC

 

Python数据分析初始(一)

标签:方便   图像处理   下载   示例   win   matlab   模块   工具包   span   

原文地址:http://www.cnblogs.com/shhnwangjian/p/6507065.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!