标签:*** 规则 lis mat change 最大值 风格 orm name
#请将下面的路径替换为你存储数据的路径 data = pd.read_excel(‘/Users/Desktop/600000.SH.xls‘)
WARNING *** OLE2 inconsistency: SSCS size is 0 but SSAT size is non-zero
data.head(3)
data.isnull().sum()
data[data[‘日期‘].isnull()]
for columname in data.columns: if data[columname].count() != len(data): loc = data[columname][data[columname].isnull().values==True].index.tolist() print(‘列名:"{}", 第{}行位置有缺失值‘.format(columname,loc))
‘‘‘ 备注 axis:0-行操作(默认),1-列操作 how:any-只要有空值就删除(默认),all-全部为空值才删除 inplace:False-返回新的数据集(默认),True-在原数据集上操作 ‘‘‘ data.dropna(axis=0, how=‘any‘, inplace=True)
import matplotlib.pyplot as plt plt.style.use(‘seaborn-darkgrid‘) # 设置画图的风格 plt.rc(‘font‘, size=6) #设置图中字体和大小 plt.rc(‘figure‘, figsize=(4,3), dpi=150) # 设置图的大小 data[‘收盘价(元)‘].plot() # 等价于 import matplotlib.pyplot as plt plt.plot(df[‘收盘价(元)‘])
data[[‘收盘价(元)‘,‘开盘价(元)‘]].plot()
plt.hist(df[‘涨跌幅(%)‘]) # 等价于 df[‘涨跌幅(%)‘].hist()
data[‘涨跌幅(%)‘].hist(bins = 30)
temp = pd.DataFrame(columns = data.columns.to_list())
for i in range(len(data)): if type(data.iloc[i,13]) != float: temp = temp.append(data.loc[i]) temp
data[data[‘换手率(%)‘].isin([‘--‘])]
data = data.reset_index()
k =[] for i in range(len(data)): if type(data.iloc[i,13]) != float: k.append(i) data.drop(labels=k,inplace=True)
data[‘换手率(%)‘].plot(kind=‘kde‘)
data[‘收盘价(元)‘].diff()
data[‘收盘价(元)‘].pct_change()
data = data.set_index(‘日期‘)
data[‘收盘价(元)‘].rolling(5).mean()
data[‘收盘价(元)‘].rolling(5).sum()
data[‘收盘价(元)‘].plot() data[‘收盘价(元)‘].rolling(5).mean().plot() data[‘收盘价(元)‘].rolling(20).mean().plot()
data[‘收盘价(元)‘].resample(‘W‘).max()
data[‘收盘价(元)‘].plot() data[‘收盘价(元)‘].resample(‘7D‘).max().plot()
data.shift(5)
data.shift(-5)
data[‘开盘价(元)‘].expanding(min_periods=1).mean()
data[‘expanding Open mean‘]=data[‘开盘价(元)‘].expanding(min_periods=1).mean() data[[‘开盘价(元)‘, ‘expanding Open mean‘]].plot(figsize=(16, 6))
data[‘former 30 days rolling Close mean‘]=data[‘收盘价(元)‘].rolling(20).mean() data[‘upper bound‘]=data[‘former 30 days rolling Close mean‘]+2*data[‘收盘价(元)‘].rolling(20).std()#在这里我们取20天内的标准差 data[‘lower bound‘]=data[‘former 30 days rolling Close mean‘]-2*data[‘收盘价(元)‘].rolling(20).std()
data[[‘收盘价(元)‘, ‘former 30 days rolling Close mean‘,‘upper bound‘,‘lower bound‘ ]].plot(figsize=(16, 6))
数据可视化基础专题(十九):Pandas120题(四)51-80
标签:*** 规则 lis mat change 最大值 风格 orm name
原文地址:https://www.cnblogs.com/qiu-hua/p/14728387.html