搜索关键字：flume hdfs sink lzo 格式压缩，搜索到6349个结果！码迷,mamicode.com！

sqoop从hdfs导出到mysql

create database logs;use logscreate table weblogs_from_hdfs(md5varchar(32),urlvarchar(64),request_datedate,request_timetime,ipvarchar(15));sqoop expor...

分类：数据库时间：2014-07-28 14:47:33 阅读次数：387

Flume采集处理日志文件

Flume简介 Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统，Flume支持在日志系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。系统功能日志收集 Flume最早是Cloud...

分类：其他好文时间：2014-07-28 14:41:13 阅读次数：491

HDFS（GFS） Python实现

HDFS（GFS） Python实现实现了HDFS的最基本的功能。具体的每一步的实现过程可以在这里看到https://github.com/DanielJyc/HDFS。每一个commit都可以执行，算是记录了自己的实现过程。总体的设计框图如下：总体设计操作：上传文件到HDFS：upload?fil...

分类：编程语言时间：2014-07-27 10:11:12 阅读次数：308

利用QJM实现HDFS自动主从切换(HA Automatic Failover)源码详析

最近研究了下NameNodeHAAutomaticFailover方面的东西，当ActiveNN因为异常或其他原因不能正常提供服务时，处于Standby状态的NN就可以自动切换为Active状态，从而到达真正的高可用NNHAAutomaticFailover架构图为了实现自动切换，需要依赖ZooKeeper和ZKFC组件，ZooKeeper主要用来..

分类：其他好文时间：2014-07-26 03:27:38 阅读次数：392

从本地上传整个文件夹到hdfs的java程序

从本地上传整个文件夹到hdfs的java程序...

分类：编程语言时间：2014-07-26 03:04:06 阅读次数：203

HDU 3416 Marriage Match IV（最短路+网络流之最大流）

题目地址：HDU 3416 这道题WA了一天半。。。最终才发现是我一直习惯性的将isap的表示上界的变量直接表示成sink+1了。。。但是在这道题里汇点sink不一定是最后一个点。。。sad。。。这题可以有两种方法做，一种是求两次最短路，d1表示所有点到源点的最短距离，再求一次用d2表示所有点到汇点的最短距离。然后根据公式d1[u]+d2[v]+w==d1[sink]判断是否属于最短路中的一...

分类：其他好文时间：2014-07-26 03:01:36 阅读次数：223

用java程序把本地的一个文件拷贝到hdfs上并显示进度

把程序打成jar包放到Linux上转到目录下执行命令 hadoop jar mapreducer.jar /home/clq/export/java/count.jar hdfs://ubuntu:9000/out06/count/ 上面一个是本地文件，一个是上传hdfs位置成功后出现：打印出来，你所要打印的字符。 package com.clq.hdfs; import java...

分类：编程语言时间：2014-07-26 02:27:17 阅读次数：270

MapReduce中Map数量的控制

InputFormat这个类是用来处理Map的输入数据的，任务开始时，InputFormat先将HDFS里所有输入文件里的数据分割成逻辑上的InputSpilt对象这里的split是HDFS中block的部分或者一整块或几个快中的数据的逻辑分割，一个split对应于一个Map，所以Map的数量是由split的数量决定的。那么怎样去确定InputSpilt的个数呢，下面列出于split个...

分类：其他好文时间：2014-07-25 11:03:11 阅读次数：204

hadoop应用开发技术详解

《大数据技术丛书：Hadoop应用开发技术详解》共12章。第1～2章详细地介绍了Hadoop的生态系统、关键技术以及安装和配置；第3章是 MapReduce的使用入门，让读者了解整个开发过程；第4～5章详细讲解了分布式文件系统HDFS和Hadoop的文件I/O；第6章分析了 MapReduce的工...

分类：其他好文时间：2014-07-24 11:25:42 阅读次数：337

java管理hdfs文件的常用类小结

最近在写一些hadoop的运维工具，考虑到hadoop本身是java编写的，api比较方便，可以直接拿来就用准备用java来写。今天测试了几个fs相关的类。主要有FileStatus,FileSystem,DistributedFileSystem,DatanodeInfo,BlockLocationFileStatus是和文件的属性相关的类，比如文件的名称，..

分类：编程语言时间：2014-07-24 10:49:36 阅读次数：303

共6349条上一页 1 ... 611 612 613 614 615 ... 635 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)