标签:cluster fas bsp family nbsp font 利用 gb2312 style
为了分析用户在不同时间段的关注行为是否有变化,先对用户的行为时间点进行分段,也就是time series segmention问题,分成几段呢?
有两种想法:1.按时间间隔距离划分,也就是转化为基于密度的聚类;
2.按照现有的文章对时间序列的划分方式,识别曲线上升、下降、稳定等状态,再对不同状态分割;
第一种想法在做的过程中也想了两种方式:1.绘制用户每周活动次数的折线图,检测折线图的峰值个数,按照峰值个数确定时间序列分割段数;
2.计算用户每个活动之间的时间间隔绘制散点图,利用Alex Rodriguez和Alessandro Laio发表的《Clustering by fast search and find of density peaks》中提到的方法进行聚类;
第二种想法暂时总觉得跟我想要的结果不太一致,暂不考虑。
标签:cluster fas bsp family nbsp font 利用 gb2312 style
原文地址:https://www.cnblogs.com/kjkj/p/9732655.html