Hive三种不同的数据导出的方式

时间：2015-12-24 00:18:52 阅读：334 评论：0 收藏：0 [点我收藏+]

标签：

转自：http://blog.chinaunix.net/uid-27177626-id-4653808.html

Hive三种不同的数据导出的方式，根据导出的地方不一样，将这些方法分为三类：
（1）导出到本地文件系统

（2）导出到HDFS

（3）导出到hive的另一个表中

导出到本地文件系统

技术分享

执行：

hive> insert overwrite local directory ‘/root/student‘

> select * from student;

通过insert overwrite local directory将hive中的表student的内容倒到本地文件系统的/root下的student目录下，这条HQL的执行需要启用Mapreduce完成，运行完这条语句之后，将会在本地文件系统的/root/student目录下生成文件，这个文件是Reduce产生的结果（这里生成的文件名是000000_0），我们可以看看这个文件的内容：

技术分享

可以看出这就是表student中的数据，数据之间用空格间隔开来。

注：将数据从hive倒到本地文件系统与将数据倒到hive不一样，不能用insert into实现。

导出到HDFS

将hive中的数据导出到HDFS和将数据导出到本地文件系统类似，只是命令的执行中少了一个“local”

技术分享

可以查看hdfs的对应目录，发现数据确实倒入了指定目录。

技术分享

将数据导出到hive的另一张表

技术分享

即：hive> insert into table hive_student_test
> select id,name,sex,salary
> from student;

前提是在hive中创建好目标表hive_student_test,然后执行上述操作将hive中的student表的数据依据其id,name,sex,salary字段将其导入到目标表中。查询目标表的结果：

技术分享

在hive0.11.0版本中新引进了一个新的特性，也就是当用户将hive查询结果输出到文件，用户可以只用列的分隔符，而在之前的版本中是不能指定列之间的分隔符的。例如：

hive> insert overwrite local directory ‘/root/student‘

> row format delimited

> fields terminated by ‘\t‘

> select * from student;

还可以用hive的-e和-f参数来导出数据，其中-e表示后面直接带双引号的sql语句；而-f是接一个文件，文件的内容为一个sql语句。如下所示：

执行：./hive -e "select * from student" >> /root/student11.txt

技术分享

这个得到的结果也是用\t分割的。也可以用-f实现。

执行：./hive -f /root/SQL.sql >> /root/student12.txt

技术分享

Hive三种不同的数据导出的方式

标签：

原文地址：http://www.cnblogs.com/cxzdy/p/5071707.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行