内容目录 1. 统计函数 2. 窗口函数 3. 加深加强 数据准备 1.统计函数 最常见的计算工具莫过于一些统计函数了。 这里我们首先构建一个包含了用户年龄与收入的 DataFrame。我们可以通过 cov 函数来求出年龄与收入之间的协方差,计算的时候会丢弃缺失值。除了协方差之外,我们还可以通过 c ...
分类:
其他好文 时间:
2019-03-11 23:38:30
阅读次数:
252
一.缺失值 sklearn中的preprocessing下游imputer,可进官方文档参考。这里主讲pandas。 拿到数据,一般先检查是否有缺失值,用isnul()或notnull(). 再决定dropna(),还是fillna()。 1.1 检查是否有缺失值 isnull()、notnull( ...
分类:
其他好文 时间:
2019-03-07 00:52:10
阅读次数:
239
pandas主要为数据预处理 DataFrame import pandas food_info = pandas.read_csv("路径") #绝对路径和相对路径都可以 type(food_info)为DataFrame food_info.dtype_ #文件中数据的类型 food_info. ...
分类:
编程语言 时间:
2019-03-06 19:32:35
阅读次数:
273
#导入pandas import pandas as pd import numpy as np #导入SqlAlchemy from sqlalchemy import create_engine if __name__ == "__main__": #建立数据库引擎 engine = creat... ...
分类:
数据库 时间:
2019-03-06 12:08:04
阅读次数:
196
利用 groupby apply list 分组合并字符 因为需要对数据进行分组和合并字符,找到了以下方法。 有点类似 SQL 的 Group BY。 参考 pandas.DataFrame.groupby https://pandas.pydata.org/pandas docs/stable/r ...
分类:
移动开发 时间:
2019-03-05 09:41:01
阅读次数:
401
1 简介 DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表。 或许说它可能有点像matlab的矩阵,但是matlab的矩阵只能放数值型值(当然matlab也可以用cell存放多类型数据),DataFrame的单元格可以存放数值、字符串等,这和excel ...
分类:
其他好文 时间:
2019-03-04 20:38:35
阅读次数:
152
DataFrame 类型类似于数据库表结构的数据结构,其含有行索引和列索引,可以将DataFrame 想成是由相同索引的Series组成的Dict类型。在其底层是通过二维以及一维的数据块实现. 1,DataFrame 对象的构建 2指定列的顺序 gendered1 = pd.DataFrame(li ...
分类:
其他好文 时间:
2019-03-04 11:31:47
阅读次数:
153
pandas基础 Series DataFrame 1 import pandas as pd 2 import numpy as np 3 4 # 创建Series 索引为默认值 5 a = pd.Series([1, 2, 3, 4]) 6 print(a) 7 print(a.values) ...
分类:
其他好文 时间:
2019-03-02 17:18:47
阅读次数:
223
写在前面: A DataFrame is a Dataset organized into named columns. A Dataset is a distributed collection of data. 贴代码: 简单的csv文件: infos.csv 更多相关小demo:每天一个程序: ...
分类:
其他好文 时间:
2019-02-27 16:09:48
阅读次数:
322
以各个城市的天气为例, 先准备下面的数据: 印度天气的相关信息: 美国天气的相关信息: 用 concat 组合上面两个 dataframe: 输出: 上面的输出最左边的序列号是重复的, 原因是数据分别来自两个 dataframe 的索引值, 可以通过忽略原本的索引来做改变: 输出: 下面再介绍另一种 ...
分类:
其他好文 时间:
2019-02-25 01:03:30
阅读次数:
182