标签:lower property border def taf 位置 str rop uri
确定四分位数的位置有两种方法, 方法1 pos = (n+1)p 方法2 pos = 1+(n-1)p
pandas 中使用的是方法2确定的。默认使用linear插值
df
#默认使用的是linear插值
#data1列
#pos=1+(5-1)*0.1=1.4 fac=0.4, -1.700586+(-1.337130-(-1.700586))*0.4=-1.555204
df.quantile([0.05,0.95]) #注意中括号
def cap_outliers(ser,lower,higher):
low,high=ser.quantile([lower,higher])
ser[ser<low]=low
ser[ser>high]=high
return (ser)
cap_outliers(df[‘data1‘],0.05,0.95)
标签:lower property border def taf 位置 str rop uri
原文地址:https://www.cnblogs.com/liyun1/p/11261878.html