码迷,mamicode.com
首页 >  
搜索关键字:flume hdfs sink 过程分析    ( 6791个结果
Flume-NG启动过程源码分析(三)(原创)
上一篇文章分析了Flume如何加载配置文件的,动态加载也只是重复运行getConfiguration()。 本篇分析加载配置文件后各个组件是如何运行的? 加载完配置文件订阅者Application类会收到订阅信息执行: @Subscribe public synchronized voi...
分类:其他好文   时间:2014-07-22 23:16:35    阅读次数:527
Hadoop single Node cluster
目的:本文描述怎么安装和配置一个单结点的Hadoop,以便搭建能快速简单操作和使用Hadoop的MapReduce和Hadoop的分布式文件系统(HDFS);先决条件:支持的平台GNU/Linux 可用作开发和生产平台. Hadoop 在GNU/Linux clusters with 2000 no...
分类:其他好文   时间:2014-07-22 23:14:55    阅读次数:435
Hadoop初学指南(6)--MapReduce的简单实例及分析
本文在上一节的基础上通过一个简单的MR示例对MapReduce的运行流程进行分析。假设有两行数据,分别是helloyou,hellome,我们要统计其中出现的单词以及每个单词出现的次数。所得的结果为hello2you1me1(1)大致运行流畅1.解析成2个<k,v>,分别是<0,helloyou><10,hel..
分类:其他好文   时间:2014-05-03 01:51:40    阅读次数:382
HDFS追本溯源:租约,读写过程的容错处理及NN的主要数据结构
Lease 的机制:hdfs支持write-once-read-many,也就是说不支持并行写,那么对读写的互斥同步就是靠Lease实现的。Lease说白了就是一个有时间约束的锁。客户端写文件时需要先申请一个Lease,对应到namenode中的LeaseManager,客户端的client name就作为一个lease的holder,即租约持有者。LeaseManager起什么作用呢? 读写过程的容错是怎么做的?数据块是如何复制的?数据块的恢复机制?本文都有涉及。...
分类:其他好文   时间:2014-05-02 23:22:14    阅读次数:450
HDFS集中式缓存管理(Centralized Cache Management)
Hadoop从2.3.0版本开始支持HDFS缓存机制,HDFS允许用户将一部分目录或文件缓存在HDFS当中,NameNode会通知拥有对应块的DataNodes将其缓存在DataNode的内存当中 集中式缓存管理有着许多显著的优势: 防止那些被频繁使用的数据从内存中清除因为DataNode的缓存由NameNode来管理,applications在做任务安排时可以查询这个缓存的列表,...
分类:其他好文   时间:2014-05-01 17:45:58    阅读次数:379
Hadoop的文件读写操作流程
以下主要讲解了Hadoop的文件读写操作流程:读文件 读文件时内部工作机制参看下图: 客户端通过调用FileSystem对象(对应于HDFS文件系统,调用DistributedFileSystem对象)的open()方法来打开文件(也即图中的第一步),DistributedFileSystem通.....
分类:其他好文   时间:2014-04-30 13:39:04    阅读次数:375
hadoop生态系统默认端口集合
1 HDFS服务中,默认端口集合:  1. HDFS 端口 Service Servers Default Ports Used Protocol Description Need End User Access? Configuration Parameters NameNode WebUI Master Nodes (NameNo...
分类:其他好文   时间:2014-04-29 13:24:21    阅读次数:492
HBase的JavaAPI使用
Java Client API Overview HBase是用Java写的,支持用编程语言来动态操作管理数据库,能用命令行做的都可以用API来做。 基本的使用过程如下: 1.创建一个 Configuration 对象 –从 HDFS 对象中调用 Configuration  –添加 HBase 属性 Configuration conf = HbaseConfiguration....
分类:编程语言   时间:2014-04-29 13:12:21    阅读次数:410
Hadoop自学笔记(五)配置分布式Hadoop环境
如何把Hadoop配置到多台机器中,构建分布式数据处理环境...
分类:其他好文   时间:2014-04-28 10:44:41    阅读次数:293
Hdfs的ACL测试
Hadoop从2.4.0版本开始支持hdfs的ACL,在CDH5.0当中也继承了该特性,下面对其进行一些测试: 一、启用ACL: dfs.permissions.enabled true dfs.namenode.acls.enabled true 二、测试ACL: ① [hadoop@master ~]$ groups hadoop 创建目录并上传文件: [...
分类:其他好文   时间:2014-04-27 21:18:00    阅读次数:306
6791条   上一页 1 ... 677 678 679 680 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!