标签:
在R的使用过程中我们几乎都绕不开Hadley Wickham 开发的几个包,前面说过的ggplot2、reshape2以及即将要讲的dplyr
因为这几个包可以非常轻易的使我们从复杂的数据操作中逃离,操作过程简洁,最重要的是数据结果也异常简洁。
首先我们来了解下第一个函数filter()
filter(.data, ...)
参数很简单,只有data,即要操作的数据对象,其他都是数据操作条件。
下面看一些简单的例子
library(dplyr) x<-data.frame(id=1:6, name=c("wang","zhang","li","chen","zhao","song"), shuxue=c(89,85,68,79,96,53), yuwen=c(77,68,86,87,92,63))
dim(x)#查看数据行列属性
[1] 6 4
x
filter(x,name=="zhang")
filter(x,shuxue>60,yuwen<90)
可以进行多条件筛选,条件可以用逗号隔开
filter(x,shuxue>80|yuwen<80)
多条件筛选,也可以用连接符&或| 进行连接。
相对而言,filter()还是比较简单,使用过程主要还是要看个人的灵活程度。
标签:
原文地址:http://www.cnblogs.com/wkslearner/p/5738693.html