标签:外部 操作 bsp 根据 ram mutate 作用域 rar 接受
dplyr包可用于处理 R 内部或者外部的结构化数据,相较于plyr包,dplyr包专注接受 data.frame 对象,大幅提高了速度,并且提供了更稳健的数据库接口。同时,dplyr包可用于操作Spark的dataframe。
install.packages("dplyr")
library("dplyr")
-- 根据值选择记录 filter()
-- 对行重新排序 arrange()
-- 根据名字选择变量 select()
-- 根据已知的变量创建新的变量 mutate()
-- 将许多值塌缩为单个描述性汇总 summarize()
-- 分组 group_by() 这些函数都可以通过 group_by() 衔接起来,该函数改变上述每个函数的作用域,从操作整个数据集到按组与组进行操作。
标签:外部 操作 bsp 根据 ram mutate 作用域 rar 接受
原文地址:https://www.cnblogs.com/0820LL/p/11188746.html