码迷,mamicode.com
首页 > 其他好文 > 详细

R基本数据管理(学习笔记)

时间:2015-07-09 17:53:18      阅读:158      评论:0      收藏:0      [点我收藏+]

标签:

对于数据的管理,有一些个人的理解,再次申明,这只是我个人的学习笔记,不喜勿喷.

1、变量的重编码:

solution one:

类似于python的列表表达式,其加强版为within(),在使用这种方法的时候,千万要注意语句的执行顺序,这个对最终的结果影响很大

example:

对于women这个dataframe,

data<-women

data<-within(data,
+ {
+ level<-"low"
+ level[height<60]<-"mid"
+ level[height<70]<-"normal"
+ level[height>=70]<-"high"
+ })

这种写法是不行的,原因是:后一个赋值会覆盖掉前面的赋值: level[height<70]<-"normal"会覆盖掉 level[height<60]<-"mid"(小于60的必然会小于70)

这样, level[height<60]<-"mid"就不会起作用。

solution two:

使用car包的recode()函数
solution three:
使用doBy的recodevar()函数
solution four:
使用自带的函数cut()

 

R基本数据管理(学习笔记)

标签:

原文地址:http://www.cnblogs.com/eifer/p/4633672.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!