码迷,mamicode.com
首页 > 其他好文 > 详细

pandas 技巧

时间:2019-11-01 11:20:00      阅读:70      评论:0      收藏:0      [点我收藏+]

标签:with open   top   pickle   poi   star   column   arp   values   from   

 

find index of top 3 largest values of each column:

 

df1.apply(lambda s: pd.Series(s.nlargest(3).index))

 

map dataframe column

df["ItemIdx"] = df["question"].map(lambda x: itemMap.get(x,np.NaN))

 

load a dictionay from a save pkl file

with open ("l.pkl","rb") as f:
    itemMap= pickle.lead(f)

 

find the startpoint of each session (after sorted):

offset = np.zeros(df["sessinId"].nunique()+1,dtype=np.int32)
offset[1:] = df.groupby(‘sessinId‘).size().cumsum()

 

pandas 技巧

标签:with open   top   pickle   poi   star   column   arp   values   from   

原文地址:https://www.cnblogs.com/pocahontas/p/11775756.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!