标签:
一:背景
某些业务的数据来源可能不同,且数据源中的分割方式也不同,导致在MapReduce编程时使用的格式化类会不同,为了包装不同的Map输出,Hadoop提供了GenericWritable类,允许我们同时操作多个不同的Map输出,输出到一个Reduce中进行处理。
技术实现:
我们对HDFS中两个不同的数据源进行处理,数据源如下(hello文件中的内容是通过制表符来分割的,hello2中的内容是通过逗号来分割的):
为了同时处理这两个文件,我们要使用不同的Map进行处理。源码如下:
输出结果:
标签:
原文地址:http://www.cnblogs.com/thinkpad/p/5173725.html