码迷,mamicode.com
首页 >  
搜索关键字:sequencefile    ( 60个结果
MapReduce 重要组件——Recordreader组件
(1)以怎样的方式从分片中读取一条记录,每读取一条记录都会调用RecordReader类;(2)系统默认的RecordReader是LineRecordReader,如TextInputFormat;而SequenceFileInputFormat的RecordReader是SequenceFile...
分类:其他好文   时间:2014-11-07 23:27:35    阅读次数:263
Hadoop中SequenceFile的使用
本文章详细叙述了hadoop中SequenceFile的使用,包括普通的使用方法及在mapreduce中的使用...
分类:其他好文   时间:2014-10-13 16:11:19    阅读次数:267
MapFile
MapFile是排序后的SequenceFile, 这个排序是由开发者来保证的, 不是内存实现.相当于对key作了一个分块索引, 只针对key.缺点1.文件不支持复写操作,不能向已存在的SequenceFile(MapFile)追加存储记录2.当write流不关闭的时候,没有办法构造read流。也就...
分类:其他好文   时间:2014-09-18 13:01:44    阅读次数:171
[译]SequenceFile、MapFile、SetFile、ArrayFile、BloomMapFile
Apache Hadoop的SequenceFile提供了一种把数据以二进制key-value对的形式保存到hdfs上的方式。跟其他key-value 数据结构相比(比如B-Tree),SequenceFile不能修改、删除数据,也不能在数据中间插入数据。SequenceFile只能往尾 部追加数据...
分类:其他好文   时间:2014-08-07 22:34:48    阅读次数:294
2014-08-4
今天做的就是将fpg跑出来的结果进行各种指标计算,但是因为用python还是不是特别熟悉,因为没有找到python能处理类似SequenceFile这样的类库,所以就用java编写,这下就是折腾各种包引用,就是classpath的引用。由于涉及到hadoop和mahout的包,这样需要添加到cl.....
分类:其他好文   时间:2014-08-05 00:30:28    阅读次数:239
TextFile SequencFile性能对比
首先所有的输入格式都继承FileInputFormat,对于TextFile和SequenceFile有对应的TextInputFormat和SequenceFileInputFormat。我们先来看一下TextInputFormat的实现:publicclassTextInputFormatextendsFileInputFormat<LongWritable,Text> implementsJobConfigurable{ p..
分类:其他好文   时间:2014-08-04 18:17:29    阅读次数:677
hadoop SequenceFile介绍
SequenceFile是一个由二进制序列化过的key/value的字节流组成的文本存储文件。基于压缩类型CompressType,共有三种SequenceFileWriter:publicstaticenumCompressionType{ /**不压缩*/ NONE, /**只压缩value*/ RECORD, /**压缩很多记录的key/value成一块*/ BLOCK }Therearethre..
分类:其他好文   时间:2014-07-31 03:19:07    阅读次数:486
Spark上对SequenceFile的支持
本文介绍了spark对hadoop sequencefile的读写支持,实现方式以及简单的使用方法。sequencefile和textfile类似,在上下文里有直接提供读取方法,但最终走的还是hadoopFile方法。...
分类:其他好文   时间:2014-07-10 17:11:52    阅读次数:951
MR之SequenceFile详解
package com.leaf.hadoop.second; import java.util.Random; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import org.apache.hado...
分类:其他好文   时间:2014-06-27 10:00:17    阅读次数:294
hive 存储格式
hive有textFile,SequenceFile,RCFile三种文件格式。textfile为默认格式,建表时不指定默认为这个格式,导入数据时会直接把数据文件拷贝到hdfs上不进行处理。SequenceFile,RCFile格式的表不能直接从本地文件导入数据,数据要先导入到textfile格式的...
分类:其他好文   时间:2014-05-19 08:33:35    阅读次数:349
60条   上一页 1 ... 4 5 6
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!