码迷,mamicode.com
首页 > 其他好文 > 详细

Spark高级数据分析中文版-读者交流

时间:2015-12-03 21:05:40      阅读:159      评论:0      收藏:0      [点我收藏+]

标签:

备注:
1.本书第二章样例数据由于才有的是短链接,国内的用户可能无法下载。我把数据集拷贝到百度网盘上。大家可以从这个地方下载:
http://pan.baidu.com/s/1pJvjHA7

谢谢读者钱先生指出这个问题。

2.P11,要记得设置log4j.properties文件,将日志级别改为WARN,否则看到的输出可能不太一样:有许多的INFO!

勘误表:
1.第2章P16页开始部分,“创建RDD的动作(action)并不会导致集群执行分布式计算”中“创建RDD的动作(action)”有错误,应该是“创建RDD的操作”

2.第2章P30页中间的运行结果应该是:
(1007, 0.2854529057466858)
(5645434, 0.09104268062279874)
(0, 0.6838772482597568)
(5746668, 0.8064147192926266)
(0, 0.03240818525033484)
(795, 0.7754423117834044)
(795, 0.5109496938298719)
(795, 0.7762059675300523)
(12843, 0.9563812499852178)

每行后面的序号和括号是没有的!

Spark高级数据分析中文版-读者交流

标签:

原文地址:http://www.cnblogs.com/littlesuccess/p/5017300.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!