InputFormat中的Splits集合的获取;
InputFormat是一个接口,该接口有2个成员函数;
InputSplit[] getSplits(JobConf job, int numSplits) throws IOException;
RecordReader<K, V> getRecordReader(InputSplit split, JobConf job, Reporter reporter) throws IOException;
而FileInputFormat是继承了InputFormat接口的类,故而它需要实现这两个函数;
对于第一个函数实现:
MapReduce之InputFormat和OutFormat,布布扣,bubuko.com
MapReduce之InputFormat和OutFormat
原文地址:http://www.cnblogs.com/miner007/p/3740103.html