码迷,mamicode.com
首页 >  
搜索关键字:scala spark    ( 10387个结果
Spark 颠覆 MapReduce 保持的排序记录
在过去几年,Apache Spark的采用以惊人的速度增加着,通常被作为MapReduce后继,可以支撑数千节点规模的集群部署。在内存中数 据处理上,Apache Spark比MapReduce更加高效已经得到广泛认识;但是当数据量远超内存容量时,我们也听到了一些机构在Spark使用 上的困扰。因此,我们与Spark社区一起,投入了大量的精力做Spark稳定性、扩展性、性能等方面的提升。既然Spa...
分类:编程语言   时间:2014-10-13 07:52:29    阅读次数:214
编译 spark-1.1.0版本方法
编译 hadoop 版本的命令如下,可以直接使用 make-distribution.sh 脚本来编译,命令如下: ./make-distribution-noclean.sh --tgz -Pyarn -Phive -Phadoop-2.4 -Dhadoop.version=2.4.0 然后就在当前目前会生成一个 tgz 的文件。 如果是编译 cdh 版本的话,参考命令如下: ./mak...
分类:其他好文   时间:2014-10-11 15:19:35    阅读次数:204
Spark:用Scala和Java实现WordCount
为了在IDEA中编写scala,今天安装配置学习了IDEA集成开发环境。IDEA确实很优秀,学会之后,用起来很顺手。关于如何搭建scala和IDEA开发环境,请看文末的参考资料。用Scala和Java实现WordCount,其中Java实现的JavaWordCount是spark自带的例子($SPA...
分类:编程语言   时间:2014-10-10 23:51:34    阅读次数:528
【Spark亚太研究院系列丛书】Spark实战高手之路-第一章 构建Spark集群(第五步)(3)
第四步修改配置文件slaves,如下所示:我们设置Hadoop集群中的从节点为SparkWorker1和SparkWorker2,把slaves文件的内容修改为:第五步修改配置文件core-site.xml,如下所示:把core-site.xml文件的内容修改为:上述是core-site.xml文件的最小化配置,core-site.xml各项配置可..
分类:其他好文   时间:2014-10-10 17:15:24    阅读次数:210
【Spark亚太研究院系列丛书】Spark实战高手之路-第一章 构建Spark集群(第五步)(3)
第四步修改配置文件slaves,如下所示: 我们设置Hadoop集群中的从节点为SparkWorker1和SparkWorker2,把slaves文件的内容修改为: 第五步修改配置文件core-site.xml,如下所示: 把core-site.xml文件的内容修改为: 上述是core-site.xml文件的最小化配置,core-si...
分类:其他好文   时间:2014-10-10 12:26:24    阅读次数:148
【Spark亚太研究院系列丛书】Spark实战高手之路-第一章 构建Spark集群(第五步)(3)
第四步修改配置文件slaves,如下所示: 我们设置Hadoop集群中的从节点为SparkWorker1和SparkWorker2,把slaves文件的内容修改为: 第五步修改配置文件core-site.xml,如下所示: 把core-site.xml文件的内容修改为...
分类:其他好文   时间:2014-10-10 11:56:15    阅读次数:118
sparkSQL1.1入门之二:sparkSQL运行架构
在介绍sparkSQL之前,我们首先来看看,传统的关系型数据库是怎么运行的。当我们提交了一个很简单的查询: SELECT a1,a2,a3 FROM tableA Where condition 可以看得出来,该语句是由Projection(a1,a2,a3)、Data Source(tableA)、Filter(condition)组成,分别对应sql查询过程中的Result...
分类:数据库   时间:2014-10-10 10:48:14    阅读次数:2980
【Spark亚太研究院系列丛书】Spark实战高手之路-第一章 构建Spark集群(第五步)(2)
把下载下来的“hadoop-2.2.0.tar.gz”拷贝到“/usr/local/hadoop/”目录下并解压:修改系统配置文件,修改~/.bashrc文件配置“HADOOP_HOME”并把“HADOOP_HOME”下的bin文件夹加入PATH中,修改完后使用source命令使配置生效。接下来在hadoop目录下按照如下命令创建文件夹:接下..
分类:其他好文   时间:2014-10-09 20:58:38    阅读次数:216
使用IntelliJ IDEA 13搭建Android集成开发环境(图文教程)
【开发环境】 操作系统:Win 7旗舰版 一、IntelliJ IDEA的引入: 2013年,IntelliJ IDEA小组已经与众多业内领先的开发技术建立了非常紧密的关系:例如Android, Spring, Scala和Gradle. 这样一来,我么就能够在百舸争流中保持领先,为开发者提供最优质...
分类:移动开发   时间:2014-10-09 18:42:07    阅读次数:239
html5实现大文件断点续传
项目中实现的html5断点续传。使用spark-md5.js计算文件MD5值,resumable.js和file api实现断点续传。后台使用java接收文件流,不支持html5的浏览器使用插件进行断点续传。以下是html5的demo:
分类:Web程序   时间:2014-10-09 17:27:28    阅读次数:344
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!