码迷,mamicode.com
首页 > 其他好文 > 详细

DataStage中merge、lookup、join的区别与联系

时间:2017-05-23 15:50:09      阅读:204      评论:0      收藏:0      [点我收藏+]

标签:事实表   key值   功能   性能   处理过程   不能   ast   表连接   stage   

三者功能类似,都可以将表连接起来进行输出。

区别主要体现在性能上。

lookup就是一个表在另一个表中找,处理过程都在内存进行,因此占用内存较多,一般大事实表和小纬表用这种方式关联效率高。

merge和join的处理过程不需用占大量内存。不同在于merge要先把key值排序在做join,因此要求key不能重复,Merge的输出集可以设为多个。

DataStage中merge、lookup、join的区别与联系

标签:事实表   key值   功能   性能   处理过程   不能   ast   表连接   stage   

原文地址:http://www.cnblogs.com/genezhao/p/6894199.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!