下载源码&编译:git clone https://github.com/databricks/spark-avro.gitsbt/sbt packageMaven GAV:groupId: com.databricks.sparkartifactId: spark-avro_2.10version...
分类:
数据库 时间:
2014-12-24 11:31:53
阅读次数:
305
下载源码&编译:git clone https://github.com/databricks/spark-csv.gitsbt/sbt packageMaven GAV:groupId: com.databricks.sparkartifactId: spark-csv_2.10version: ...
分类:
数据库 时间:
2014-12-24 11:27:55
阅读次数:
514
我们知道spark可以将运行过的RDD存储到内存上, 并在需要的时候重复利用. 那么spark是怎么完成这些工作的, 本文将通过分析源码来解释RDD的重复利用过程. 在上一篇文章解释了spark的执行机制, DAGScheduler负责分解action, 在DAGScheduler.getMi...
分类:
其他好文 时间:
2014-12-23 22:30:39
阅读次数:
915
Java领域的IM解决方案Java领域的即时通信的解决方案可以考虑openfire+spark+smack。Openfire是基于Jabber协议(XMPP)实现的即时通信服务器端,最新版本是3.8.1可以到http://www.igniterealtime.org/downloads/index....
分类:
其他好文 时间:
2014-12-23 22:28:25
阅读次数:
685
在Spark1.2.0版本中是用parquet存储类型时注意事项:sql语句:select * from order_created_dynamic_partition_parquet;在spark-sql中执行结果:2014-05 [B@4621484a [B@3311163e2014-0...
分类:
数据库 时间:
2014-12-23 19:17:22
阅读次数:
326
课程下载地址:链接:http://pan.baidu.com/s/1kTggcb9密码:9mfn网盘失效的话,请加QQ:3113533060课程内容:第一周Spark生态系统概述与编程模型Spark生态系统概述回顾HadoopMapReduceSpark运行模式RDDSpark运行时模型简介缓存策略介绍transformationactionlineage容错处理宽依..
分类:
其他好文 时间:
2014-12-23 17:46:36
阅读次数:
196
akka_2.10-2.3.8scala2.10.41.按一般的方式将akka_2.10-2.3.8\akka-2.3.8\lib下的jar包加入build-path2.报错:akka是指scala-2.10编译的,与当前scala的版本不匹配3.配置编译检查,取消版本检查。scala是向后兼容的,版本高一点问题不大
分类:
其他好文 时间:
2014-12-23 10:40:44
阅读次数:
153
1.2.0 was released on 12/18, 2014
在2014年5月30日发布了Spark 1.0 和9月11日发布了Spark1.1.后,Spark 1.2 终于在12月18日发布。作为1.X时代的第三个release,它有什么重要更新呢?...
分类:
其他好文 时间:
2014-12-23 07:56:55
阅读次数:
168
Spark是当今大数据领域最活跃最热门的高效的大数据通用计算平台,基于RDD,Spark成功的构建起了一体化、多元化的大数据处理体系,在“OneStacktorulethemall”思想的引领下,Spark成功的使用SparkSQL、SparkStreaming、MLLib、GraphX近乎完美的解...
分类:
其他好文 时间:
2014-12-23 06:41:54
阅读次数:
192
这是世界上第一个Spark内核高端课程:1,该课程在对Spark的13个不同版本源码彻底研究基础之上提炼而成;2,课程涵盖Spark所有内核精髓的剖析;3,课程中有大量的核心源码解读;4,全景展示Spark商业案例下规划、部署、开发、管理技术;5,涵盖Spark核心优化技巧该课程是Spark的高端课...
分类:
其他好文 时间:
2014-12-23 06:41:00
阅读次数:
182