标签:灵活 and 窗口 大数据集 数据 dataframe 日期 nump exe
pandas是数据分析必不可少的工具之一
那么pandas主要用来做什么?(或者说擅长做什么呢)
轻松处理浮点与非浮点的缺失数据
通过DataFrame或者更高维的对象可以完成列的增加与删除
自动和显式地完成数据对齐
强大且灵活的group by功能可对数据集执行拆分应用组合操作,用于聚合和转换数据
轻松的将Python中的ragged, differently-indexed以及numpy数据结构转为DataFrame对象
可以对大数据集上完成基于智能标签的切片,花式索引和子集
直观的合并和连接数据集
灵活的重塑和数据集的旋转
轴的分层标记(可能每个标记有多个标签)
健壮的IO操作,包括对csv文件、excel文件、数据库以及HDF5格式文件的读和写完成时间序列的特定功能,如:日期范围生成和频率转换,移动窗口统计,移动窗口线性回归,日期偏移和滞后等
标签:灵活 and 窗口 大数据集 数据 dataframe 日期 nump exe
原文地址:https://www.cnblogs.com/dreamall/p/11986560.html