码迷,mamicode.com
首页 >  
搜索关键字:大数据 spark 倒排索引    ( 19162个结果
Apache Spark源码走读之6 -- 存储子系统分析
Spark计算速度远胜于Hadoop的原因之一就在于中间结果是缓存在内存而不是直接写入到disk,本文尝试分析Spark中存储子系统的构成,并以数据写入和数据读取为例,讲述清楚存储子系统中各部件的交互关系。
分类:其他好文   时间:2014-05-09 05:14:32    阅读次数:405
大数据科普
转自 http://www.cstor.cn/textdetail_6531.html
分类:其他好文   时间:2014-05-09 03:37:49    阅读次数:201
在eclipse中配置spark 0.9.1源码的开发环境
一、准备工作: 1、下载release版spark 0.9.1,本次用的版本是spark-0.9.1-bin-cdh4。 2、下载scala IDE 3.0.2,这个版本ide的支持scala 2.10版。 二、配置工作 1、在ide中新建scala项目,注意jre要用jdk1.7版的。如下图: 2...
分类:系统相关   时间:2014-05-09 03:27:34    阅读次数:512
基于HBASE的并行计算架构之rowkey设计篇
1.大数据在HBASE存储、计算以及查询的应用场景海量数据都是事务数据,事务数据都是在时间的基础上产生的。数据的业务时间可能会顺序产生,也可能不会顺序产生,比如某些事务发生在早上10点,但是在下午5点才结束闭并生成出来,这样的数据就会造成存储加载时的时间连续性。另外海量数据的挖掘后产生的是统计数据,...
分类:其他好文   时间:2014-05-09 03:03:39    阅读次数:347
ODPS 下map / reduce 的编写
接到阿里电话说实习和竞赛智能二选一, 真伤心, 在实习前发挥余热吧.      总结一下在ODPS下 编写map / reduce 和进行购买预测的过程.      首先这里的hadoop输入输出都是表的形式, 我们需要一张输入表和一张输出表.    输入表为 提供的 t_alibaba_bigdata_user_brand_total_1  输出表为自定义的wc_out    w...
分类:其他好文   时间:2014-05-09 02:33:28    阅读次数:418
Spork: Pig on Spark实现分析
介绍 Spork是Pig on Spark的highly experimental版本,依赖的版本也比较久,如之前文章里所说,目前我把Spork维护在自己的github上:flare-spork。 本文分析的是Spork的实现方式和具体内容。 Spark Launcher 在hadoop executionengine包路径下,写了一个Spark启动器,同MapReduceLauncher类似,会在launchPig的时候,把传入的物理执行计划进行翻译。 MR启动器翻译的是MR的操作,以及进一步的MR...
分类:其他好文   时间:2014-05-09 02:08:17    阅读次数:358
[BZOJ3568]DZY Loves Math VII
本人BZOJ的处女作。这题题面还是蛮有趣的吧。然后三个问题都蛮有意思的。要保证正确性,出数据还是异常蛋疼啊。本来各出三题的。但是考虑到是OJ上的题,就搞在一起了。这样代码量就会比较大。
分类:其他好文   时间:2014-05-08 23:47:58    阅读次数:846
Hadoop全分布模式操作
http://blog.csdn.net/wangloveall/article/details/20767161摘要:介绍Hadoop全分布模式操作,实现真正意义上的集群架构。关键词:Hadoop 全分布模式 文件配置利用Hadoop解决大数据问题时,我们是用全分布模式来操作Hadoop。如何基于...
分类:其他好文   时间:2014-05-08 23:44:04    阅读次数:354
Hadoop生态系统
摘要:介绍Hadoop生态系统,从Hadoop生态系统有什么成员,成员能做什么和Hadoop生态系统能够提供大数据问题解决方案两方面来认识。关键词:Hadoop HDFS MapReduce HBase Hive PigHadoop生态图,通俗地说,就是Hadoop核心模块和衍生的子项目。一幅Ha....
分类:其他好文   时间:2014-05-08 23:16:24    阅读次数:387
Task的执行过程分析
Task的执行过程分析 Task的执行通过Worker启动时生成的Executor实例进行, caseRegisteredExecutor(sparkProperties)=> logInfo("Successfullyregistered with driver") //Make this host instead of hostPort ? executor= newExecuto...
分类:其他好文   时间:2014-05-08 16:01:31    阅读次数:667
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!