标签:
对着满屏的游戏后台数据,需要快速了解数据特征,一种茫然无从下手的感觉?
本文在游戏后台数据中,如何通过R语言快速的了解游戏后台的数据特征,以及统计各个数据之间的相关系数,并通过相关图来发现其中相关系数较高的数据,从而通过R得到高相关系数之间的线性回归方程,最后通过矩阵散点图来初步发现数据中的一些规律解决相应的问题。附:本文需要安装corrgram和car包
具体代码如下:
library(corrgram)
library(car)
summary(data9)
cor(data9)
scatterplotMatrix(data9,spread=FALSE,main="时间,横幅展示,横幅点击,注册框点击,注册数之间关系")
corrgram(data9,order=TRUE,lower.panel=panel.shade,upper.panel=panel.pie,text.
panel=panel.txt,main="时间,横幅展示,横幅点击,注册框点击,注册数之间关系")
其中以某单机网的游戏广告投放后台数据为例
通过R中的summary和cor函数可以得到图一,可以快速了解数据的基本特征和相关系数。
为了方便快速展示数据之间的关联性,可以适当通过图形展示,提高工作效率,如图二,通过使用corrgram包中的corrgram()函数产生的相关图可以快速发现注册框点击和注册的相关系数最高,达到0.98。可以用R语言得到线性回归方程,从而发现从中的规律或者转化率:
myLm<-lm(M[negotiated=TRUE]~Z[negotiate=TRUE],data=data9)
myLm$coefficients
summary(myLm)
得到结果:(Intercept)requested[negotioted==TURE]
20.81 0.21
得到注册框点击Z和注册数M的基本线性回归方程:M=20.81+0.21*Z
而下图三,载入car包中的scatterplotMatrix()函数生成的矩阵散点图,可以快速了解数据之间的规律。仅下图标记2为例,表示流量和注册数的关系,即广告流量越大,注册数越多,则渠道正常。反之,流量越大,注册数保持不变或者下降的趋势,则渠道疲劳,即该渠道对广告产生视觉疲劳,可初步考虑放弃该渠道。同理,当渠道正常,下图标记1,即时间和注册数的关系成反比,则表示用户对素材疲劳,可适当切换新素材,保持点击新鲜度。
最后本文通过R语言产生的三个图,可以快速了解数据的基本特征,数据之间的相关性,以及数据之间的分布规律和趋势规律,从而基本达到快速了解游戏后台数据目的。
作者:心者,审稿:fish
转自:http://www.itongji.cn/article/012040302015.html
标签:
原文地址:http://www.cnblogs.com/payton/p/4243450.html