处理缺失值 通过isnull和notnull方法,可以返回布尔值的对象。 这时通过求和可以获取每列的缺失值数量,再通过求和就可以获得整个DataFrame的缺失值数量 侦查缺失值 创建有缺失值的DataFeame 查看缺失值 缺失值计算 通过info()方法查看缺失值 删除缺失值 通过dropna可 ...
分类:
其他好文 时间:
2019-10-29 00:11:10
阅读次数:
109
Pandas的三种数据结构: 系列(Series) 数据帧(DataFrame) 面板(Panel) 这些数据结构,构建在Numpy数组之上,这意味着它们很快 维数和描述 考虑这些数据结构的最好方法是,较高维数据结构是其较低维数据结构的容器。 例如,DataFrame是Series的容器,Panel ...
分类:
其他好文 时间:
2019-10-28 20:32:58
阅读次数:
87
一、创建、取某列某行、删除某列 二、对一列或者多列作运算 1. 利用map对一列作运算 2.利用apply对一列或多列作运算 三、求滑动平均 四、对列作向上或向下的平移变换 五、对列作标准化处理: 六、对某列赋值 七、 对list中多个重复的字符作频数统计 参考: 《Python数据科学手册》Jak ...
分类:
其他好文 时间:
2019-10-27 12:52:45
阅读次数:
1146
Pandas 简介 Series DataFrame 时间对象处理 数据分组和聚合 其他常用方法 一 、简介 pandas是一个强大的Python数据分析的工具包,它是基于Numpy构建的,正因pandas的出现,让Python语言也成为使用最广泛而且强大的数据分析环境之一。 Pandas的主要功能 ...
分类:
其他好文 时间:
2019-10-26 17:37:43
阅读次数:
96
数据去重可以使用duplicated()和drop_duplicates()两个方法。 DataFrame.duplicated(subset = None,keep =‘first’)返回boolean Series表示重复行 参数: subset:列标签或标签序列,可选 仅考虑用于标识重复项的某 ...
分类:
编程语言 时间:
2019-10-23 23:47:20
阅读次数:
175
pandas提供了一个灵活高效的groupby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。根据一个或多个键(可以是函数、数组或DataFrame列名)拆分pandas对象。计算分组摘要统计,如计数、平均值、标准差,或用户自定义函数。对DataFrame的列应用各种各样的函数。应 ...
分类:
其他好文 时间:
2019-10-22 23:37:42
阅读次数:
109
一、区别Numpy:是数值计算的扩展包,它能高效处理N维数组,复杂函数,线性代数. Panadas:是做数据处理。市python的一个数据分析包(panel datas) 二、使用方式 导入pandas和numpy模块: import pandas as pd import numpy as np ...
分类:
其他好文 时间:
2019-10-21 11:24:38
阅读次数:
85
城市气候与海洋的关系研究 导入包 1.导入数据各个海滨城市数据 2.去除没用的列 .dataframe tbody tr th:only of type { vertical align: middle; } .dataframe tbody tr th { vertical align: top; ...
分类:
其他好文 时间:
2019-10-20 20:21:53
阅读次数:
145
pandas数据处理 1. 删除重复元素 使用duplicated()函数检测重复的行,返回元素为布尔类型的Series对象,每个元素对应一行,如果该行不是第一次出现,则元素为True keep参数:指定保留哪一重复的行数据 创建具有重复元素行的DataFrame .dataframe tbody ...
分类:
其他好文 时间:
2019-10-20 20:19:50
阅读次数:
403
需求: 导入文件,查看原始数据 将人口数据和各州简称数据进行合并 将合并的数据中重复的abbreviation列进行删除 查看存在缺失数据的列 找到有哪些state/region使得state的值为NaN,进行去重操作 为找到的这些state/region的state项补上正确的值,从而去除掉sta ...
分类:
其他好文 时间:
2019-10-20 20:19:13
阅读次数:
258