码迷,mamicode.com
首页 > 其他好文 > 详细

sc.sample

时间:2015-05-11 16:02:20      阅读:314      评论:0      收藏:0      [点我收藏+]

标签:

sample是在数据源取样。

val data = sc.parallelize(1 to 20)
data.sample(true,0.4).collect

sample第一个参数表示是否是重复抽样,如果是true,则抽象的结果可能会有重复的数字。而false代表抽样的结果是没有重复的。

sample第二个参数表示抽样的数量量,0.4代表是40%

sc.sample

标签:

原文地址:http://www.cnblogs.com/hark0623/p/4494776.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!