码迷,mamicode.com
首页 > 其他好文 > 详细

第4章--基本数据管理

时间:2016-10-09 22:49:36      阅读:116      评论:0      收藏:0      [点我收藏+]

标签:

4.1 创建新变量

在典型的项目研究中,你可能需要创建新的变量或者对现有的变量进行变换。这可以通过以下语句来完成:

变量名←表达式

以上语句中的表达式部分可以分成包含多种运算符合函数。

 

4.2 变量的重编码

重编码涉及根据同一个变量和/或其他变量的现有值创建新值的过程。其中涉及到:

  • 将一个连续型变量修改为一组类别值;
  • 将误编码的值替换为正确值;
  • 基于一组分数线创建一个表示及格/不及格的变量

函数within(),它允许你修改数据框。

 

4.3 变量的重命名

可以使用一个fix()的函数来调用一个交互式的编辑器,单击变量名然后在弹出的对话框中将其重命名。

或者,

reshape包中有一个rename(dataframe, c(oldname="newname",))可以用来修改变量名。

 

4.4 缺失值

在R中,缺失值以符号NA表示。不可能出现的值用NaN表示。

函数is.na()允许你检测缺失值是否存在,如果某个元素是缺失值,相对应的位置将被改成TRUE,不是缺失值的位置则为FALSE。

 

4.5 日期值

日期值通常以字符串的形式输入到R中,然后转换为以数值形式存储的日期变量。函数as.Date()用于执行这种转换。

有两个函数对于处理时间戳数据特别实用。

Sys.Date()可以返回当天的日期;

data()返回当前的日期和时间。

第4章--基本数据管理

标签:

原文地址:http://www.cnblogs.com/cyoutetsu/p/5943988.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!