搜索关键字：flume spark sparkflumeprotocol，搜索到7976个结果！码迷,mamicode.com！

详细图解 Flume介绍、安装配置

写在前面一：本文总结“Hadoop生态系统”中的其中一员——Apache Flume 写在前面二：所用软件说明：一、什么是Apache Flume 官网：Flume is a distributed, reliable, and available service for efficiently collecting, aggregating, and m...

分类：其他好文时间：2014-05-26 04:32:10 阅读次数：359

Flume-NG源码阅读之SinkGroups和SinkRunner

在AbstractConfigurationProvider类中loadSinks方法会调用loadSinkGroups方法将所有的sink和sinkgroup放到了Map sinkRunnerMap之中。 SinkRunner可能对应一个sink也可能对应一个sinkgroup。因为如果配置...

分类：其他好文时间：2014-05-25 22:05:04 阅读次数：398

使用Flume进行数据的实时收集处理

在已经成功安装Flume的基础上，本文将总结使用Flume进行数据的实时收集处理，具体步骤如下：第一步，在$FLUME_HOME/conf目录下，编写Flume的配置文件，命名为flume_first_conf，具体内容如下： #agent1表示代理名称 agent1.sources=source1 agent1.sinks=sink1 agent1.channels=channel1...

分类：其他好文时间：2014-05-25 00:49:58 阅读次数：383

简单记录下spark环境搭建时的几个小问题

折腾了好几天，终于可以在CenOS下用eclipse写spark程序了当前环境是CentOS6.5,jdk7,scala2.10.4,spark0.9.1前期因为对linux不熟悉的原因花了不少时间查阅命令。折腾了不少时间，终于把jdk8，scala2.11.0环境变量配置好了。在此环境下可以正常编...

分类：其他好文时间：2014-05-23 06:01:28 阅读次数：312

Cloudera CDH 5集群搭建（yum 方式）

Hadoop CDH YUM Spark...

分类：其他好文时间：2014-05-22 22:56:05 阅读次数：521

Flume-NG源码阅读之FileChannel

FileChannel是flume一个非常重要的channel组件，非常常用。这个channel非常复杂，涉及的文件更多涉及三个包：org.apache.flume.channel.file、org.apache.flume.channel.file.encryption(加密)、org.apa.....

分类：其他好文时间：2014-05-19 13:02:06 阅读次数：285

Apache Spark源码走读之9 -- Spark源码编译

本来源码编译没有什么可说的，对于java项目来说，只要会点maven或ant的简单命令，依葫芦画瓢，一下子就ok了。但到了Spark上面，事情似乎不这么简单，按照spark officical document上的来做，总会出现这样或那样的编译错误，让人懊恼不已。

分类：其他好文时间：2014-05-18 20:25:57 阅读次数：391

Apache Spark源码走读之8 -- Spark on Yarn

Hadoop2中的Yarn是一个分布式计算资源的管理平台，由于其有极好的模型抽象，非常有可能成为分布式计算资源管理的事实标准。其主要职责将是分布式计算集群的管理，集群中计算资源的管理与分配。Yarn为应用程序开发提供了比较好的实现标准，Spark支持Yarn部署，本文将就Spark如何实现在Yarn...

分类：其他好文时间：2014-05-16 04:20:26 阅读次数：455

Spark1.0.0 学习路线

接触了Spark也快有半年了，版本从0.8.0到现在的1.0.0SNAPSHOT，从头到尾被spark这个优秀的框架深深吸引，也为scala的优雅所折服。4.19日“2014 中国Spark技术峰会”召开，可以看出随着Spark技术的完善，越来越多的企业已经开始使用或开始关注Spark的发展了。回顾学习过程，觉得很有必要整理一份学习路线，对所学的内容加以沉淀，同时也为同行作为参考。因为Spark1...

分类：其他好文时间：2014-05-15 06:07:33 阅读次数：357

HDFS HA系列实验之四：HA+Federation

本篇的配置环境是基于HDFS HA系列实验之二：HA+JournalNode+zookeeper 上进行的。1：原理图 A：实验环境之组成DNS：productserverHA1（nameservices为cluster1）：product201、product202HA2（nameservices为cluster2）：product211、product212DN：product203、p...

分类：其他好文时间：2014-05-15 05:59:29 阅读次数：323

共7976条上一页 1 ... 793 794 795 796 797 798 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)