码迷,mamicode.com
首页 > 其他好文 > 详细

用户在投时长及F、M指标的构造

时间:2019-10-04 22:29:47      阅读:95      评论:0      收藏:0      [点我收藏+]

标签:encoding   and   次数   imp   用户   values   type   xlsx   pen   

import pandas as pd
from datetime import datetime
from math import ceil #向上取整
from pandas import DataFrame
data=pd.read_excel(‘./data/data5.xlsx‘,encoding=‘gbk‘,index_col=‘用户‘)
print(data.head())
data.describe(include=‘all‘)
#构造R,F,M, recency距最近时间 frequency 频率 消费金额 monetary
exdata_date=datetime(2016,8,10)
print(exdata_date)
#R
diff_R=exdata_date-data[‘最近投资时间‘]
diff_R.head()
diff_R[1].days
type(diff_R[1].days)
R=[]
for i in diff_R:
R.append(i.days)
diff=exdata_date-data[‘首次投资时间‘]
diff_months=[]
diff[1].days
for i in diff:
diff_months.append(ceil(i.days/30))
#F 平均频次
F=(data[‘投标总次数‘]/diff_months).values
print(F)
#M 平均金额
M=(data[‘总投资金‘]/diff_months).values
cdata=DataFrame([R,list(F),list(M)]).T
cdata.columns=[‘R‘,‘F‘,‘M‘]
cdata.index=data.index

cdata.head()

用户在投时长及F、M指标的构造

标签:encoding   and   次数   imp   用户   values   type   xlsx   pen   

原文地址:https://www.cnblogs.com/tiankong-blue/p/11623382.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!