Series 和 DataFrame 的创建
import pandas as pd import numpy as np import matplotlib.pyplot as plt s = pd.Series([1, 2, 5, np.nan, 6, 8]) # 类似于 numpy 的 array 不过是一维的,仅限一维哦 # print(s) # 0 1.0 # 1 2.0 # 2 5.0 # 3 NaN # not a number 表示无穷或者非数值 # 4 6.0 # 5 8.0 # dtype: float64 dates = pd.date_range(‘20180116‘, periods=3) # 创建 16 17 18 等 3 个日期,待会儿作为行 df = pd.DataFrame(np.random.randn(3,4), index=dates, columns=list(‘ABCD‘)) # 这是二维的,类似于一个表! # 通过 numpy 随机了一个 3 * 4 的数据,这和行数、列数是相对应的 # print(df) # A B C D # 2018-01-16 -0.139759 0.857653 0.754470 0.224313 # 2018-01-17 1.565070 0.521973 -1.265168 -0.278524 # 2018-01-18 -0.668574 -0.527155 0.877785 -1.123334 # 直接通过一个字典也是可以创建 dataFrame 的。 df2 = pd.DataFrame({‘A‘ : 1., ‘B‘ : pd.Timestamp(‘20130102‘), ‘C‘ : pd.Series(1,index=list(range(4)),dtype=‘float32‘), ‘D‘ : np.array([3] * 4,dtype=‘int32‘), ‘E‘ : pd.Categorical(["test","train","test","train"]), ‘F‘ : ‘foo‘ }) # print(df2) # A B C D E F # 0 1.0 2013-01-02 1.0 3 test foo # 1 1.0 2013-01-02 1.0 3 train foo # 2 1.0 2013-01-02 1.0 3 test foo # 3 1.0 2013-01-02 1.0 3 train foo # 取得具体的类型 # print(df2.dtypes) # A float64 # B datetime64[ns] # C float32 # D int32 # E category # F object # dtype: object