标签:事实表 key值 功能 性能 处理过程 不能 ast 表连接 stage
三者功能类似,都可以将表连接起来进行输出。
区别主要体现在性能上。
lookup就是一个表在另一个表中找,处理过程都在内存进行,因此占用内存较多,一般大事实表和小纬表用这种方式关联效率高。
merge和join的处理过程不需用占大量内存。不同在于merge要先把key值排序在做join,因此要求key不能重复,Merge的输出集可以设为多个。
DataStage中merge、lookup、join的区别与联系
标签:事实表 key值 功能 性能 处理过程 不能 ast 表连接 stage
原文地址:http://www.cnblogs.com/genezhao/p/6894199.html