搜索关键字：spark streaming jobscheduler，搜索到7564个结果！码迷,mamicode.com！

用python + hadoop streaming 编写分布式程序（二） -- 在集群上运行与监控

写在前面前文：用python + hadoop streaming 编写分布式程序（一） -- 原理介绍，样例程序与本地调试为了方便，这篇文章里的例子均为伪分布式运行，一般来说只要集群配置得当，在伪分布式下能够运行的程序，在真实集群上也不会有什么问题。为了更好地模拟集群环境，我们可以在mapred-...

分类：编程语言时间：2014-05-30 14:56:56 阅读次数：309

Apache Spark源码走读之12 -- Hive on Spark运行环境搭建

Hive是基于Hadoop的开源数据仓库工具，提供了类似于SQL的HiveQL语言，使得上层的数据分析人员不用知道太多MapReduce的知识就能对存储于Hdfs中的海量数据进行分析。由于这一特性而收到广泛的欢迎。Hive的整体框架中有一个重要的模块是执行模块，这一部分是用Hadoop中MapRed...

分类：其他好文时间：2014-05-30 14:23:07 阅读次数：409

Apache Storm源码阅读笔记

自从建了Spark交流的QQ群之后，热情加入的同学不少，大家不仅对Spark很热衷对于Storm也是充满好奇。大家都提到一个问题就是有关storm内部实现机理的资料比较少,理解起来非常费劲。尽管自己也陆续对storm的源码走读发表了一些博文，当时写的时候比较匆忙，有时候衔接的不是太好，此番做了一些整...

分类：其他好文时间：2014-05-30 07:25:09 阅读次数：286

【spark系列3】spark开发简单指南

分布式数据集创建之textFile 文本文件的RDDs能够通过SparkContext的textFile方法创建，该方法接受文件的URI地址（或者机器上的文件本地路径，或者一个hdfs://, sdn://,kfs://,其他URI).这里是一个调用样例：scala> val distFile...

分类：其他好文时间：2014-05-29 18:58:27 阅读次数：429

GPU 的硬件基本概念，Cuda和Opencl名词关系对应

GPU 的硬件基本概念Nvidia的版本：实际上在 nVidia 的 GPU 里，最基本的处理单元是所谓的 SP(Streaming Processor)，而一颗 nVidia 的 GPU 里，会有非常多的 SP 可以同时做计算;而数个 SP 会在附加一些其他单元，一起组成一个 SM(Strea....

分类：其他好文时间：2014-05-28 18:59:32 阅读次数：292

简单记录下spark环境搭建时的几个小问题

折腾了好几天，终于可以在CenOS下用eclipse写spark程序了当前环境是CentOS6.5,jdk7,scala2.10.4,spark0.9.1前期因为对linux不熟悉的原因花了不少时间查阅命令。折腾了不少时间，终于把jdk8，scala2.11.0环境变量配置好了。在此环境下可以正常编...

分类：其他好文时间：2014-05-23 06:01:28 阅读次数：312

Cloudera CDH 5集群搭建（yum 方式）

Hadoop CDH YUM Spark...

分类：其他好文时间：2014-05-22 22:56:05 阅读次数：521

Apache Spark源码走读之9 -- Spark源码编译

本来源码编译没有什么可说的，对于java项目来说，只要会点maven或ant的简单命令，依葫芦画瓢，一下子就ok了。但到了Spark上面，事情似乎不这么简单，按照spark officical document上的来做，总会出现这样或那样的编译错误，让人懊恼不已。

分类：其他好文时间：2014-05-18 20:25:57 阅读次数：391

hadoop学习；Streaming，aggregate；combiner

hadoop streaming允许我们使用任何可执行脚本来处理按行组织的数据流，数据取自UNIX的标准输入STDIN,并输出到STDOUT 通过设定mapper为‘RandomSample.py 10’,我们按十分之一的采样率，没有设定特殊的reducer，一般默认使用IdentityReducer（把输入直接转向输出）通过HDFS的命令getMerge（输出合并）或其他文件操作，可以获得...

分类：其他好文时间：2014-05-18 15:12:21 阅读次数：380

ubuntu12.04上搭建darwin streaming server6.03

1：下载darwin源代码DarwinStreamingSrvr6.0.3-Source.tar,补丁patch dss-6.0.3.patch$wgethttp://dss.macosforge.org/downloads/DarwinStreamingSrvr6.0.3-Source.tar$w...

分类：Windows程序时间：2014-05-15 22:34:00 阅读次数：580

共7564条上一页 1 ... 751 752 753 754 755 ... 757 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)