码迷,mamicode.com
首页 > 其他好文 > 详细

Hive/Pig 语法简单比较

时间:2014-11-20 13:27:34      阅读:174      评论:0      收藏:0      [点我收藏+]

标签:io   ar   sp   for   数据   on   bs   ad   ef   

一句话,Hive 开发比 Pig快多了...

从hdfs读取数据:

Hive: CREATE EXTRENAL TABLE IF NOT EXIST (domain string, num int) ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘\t‘ location ‘hdfs_file‘;

Pig: LOAD ‘hdfs_file‘ USING PigStorage (‘\t‘) as (domain:chararray, num:int);

 

存储:

Hive: INSERT OVERWRITE DIRECTORY ‘target_hdfs_file‘ SELECT... ;

Pig: STORE result into ‘target_hdfs_file‘;

 

同SQL的比较:

Hive没有in和not in,"select a.key where a.key in {select b.key from b}"的实现方式为"select a.key from a left outer join b on a.key=b.key where b.key is not null;"

Pig就更麻烦了...

 

区别:

Pig存储默认分隔符‘\t‘, Hive为‘Ctrl+A‘

Hive/Pig 语法简单比较

标签:io   ar   sp   for   数据   on   bs   ad   ef   

原文地址:http://www.cnblogs.com/cs-jack-cheng/p/4110336.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!