码迷,mamicode.com
首页 >  
搜索关键字:flume hdfs sink lzo 格式压缩    ( 6349个结果
lua post
--lua代码localhttp=require"socket.http"localltn12=require("ltn12")request_body=‘u=1&parameter={"m":"S"}‘localresult=http.request{url="http://127.0.0.1/2.php",sink=ltn12.sink.file(io.stdout),method="POST",headers={["Content-Type"]="application/x-www-form..
分类:其他好文   时间:2014-08-21 19:41:35    阅读次数:489
Hbase和Hive之间的区别知多少?
Hive是为了简化编写MapReduce程序而生的,使用MapReduce做过数据分析的人都知道,很多分析程序除业务逻辑不同外,程序流程基本一样。在这种情况下,就需要Hive这样的用戶编程接口。Hive本身不存储和计算数据,它完全依赖于HDFS和MapReduce,Hive中的表纯逻辑,就是些表的定义等,也就是表的元数据。使用SQL实现Hive是因为SQL大家都熟悉,转换成本低,类似作用的Pig就...
分类:其他好文   时间:2014-08-21 19:27:44    阅读次数:148
flume-ng 中 selector multiplexing 的使用
flume-ng 中 selector的使用 在最近的项目中,需要用到flume。使用的是非常常见的结构:netcat source开启监听端口,接收发送来的报文消息,通过memory channel与sink(重写的roll file sink)写到本地磁盘。特别的是,这里需要根据报文的类型来发往不同的sink(暂且命名为sink1与sink2)。根据该需求,考虑有两种解决方案。...
分类:其他好文   时间:2014-08-21 17:08:14    阅读次数:1607
Centralized Cache Management in HDFS
Centralized Cache Management inHDFS Overview HDFS中的集中式缓存管理是一个显式的管理缓存的机制,它允许用户指定被HDFS缓存的路径。NameNode将与磁盘上有所需的Block的DataNode通信,命令其在堆外缓存里缓存Block。 HDFS中的集中式缓存管理有许多重要的优势。 1.      明确地防止频繁使用的数据被赶出内存。当工作集的...
分类:其他好文   时间:2014-08-21 15:07:24    阅读次数:346
Hadoop HDFS文件常用操作及注意事项
Hadoop HDFS文件常用操作及注意事项1.Copy a file from the local file system to HDFSThe srcFile variable needs to contain the full name (path + file name) of the fi...
分类:其他好文   时间:2014-08-21 12:50:04    阅读次数:224
Hadoop HDFS文件常用操作及注意事项
1.Copy a file from the local file system to HDFSThe srcFile variable needs to contain the full name (path + file name) of the file in the local file s...
分类:其他好文   时间:2014-08-21 11:24:34    阅读次数:242
hive小结(一 )
hive partitions hdfs 内部表 外部表 view...
分类:其他好文   时间:2014-08-20 19:39:52    阅读次数:191
Flume+Kafka+Strom基于分布式环境的结合使用
目录: 一、Flume、Kafka、Storm是什么,如何安装? 二、Flume、Kafka、Storm如何结合使用? 1) 原理是什么? 2) Flume和Kafka的整合 3) Kafka和Storm的整合 4) Flume、Kafka、Storm的整合 一、Flu...
分类:其他好文   时间:2014-08-19 20:39:55    阅读次数:750
Hadoop配置文件
部分内容参考:http://www.linuxqq.net/archives/964.html       Hadoop有三个重要的配置文件:core-site.xml,hdfs-site.xml,mapred-site.xml,但这三个文件默认情况下均为空,其默认值保存在core-default.xml,hdfs-default.xml,mapred-default.xml中。这三个默...
分类:其他好文   时间:2014-08-19 12:52:44    阅读次数:205
Java API 读取HDFS的单文件
Java API 读取HDFS的单文件...
分类:编程语言   时间:2014-08-19 09:23:54    阅读次数:188
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!