标签:读取 选项 sig _for ORC orm srv text file
当需要从Hive等Hadoop集群迁移数据到GaussDB 200集群时,因为数据量太大,可能无法导出到本地。此时需要GaussDB 200跨集群读取HDFS上的数据,并写入GaussDB 200集群。目前GaussDB 200只支持跨集群访问FusionInsight HD中的HDFS。
登录FusionInsight Manager>选择“集群 > 待操作的集群名称 > 服务 > MPPDB > 对接 > 对接HDFS”,单击“创建”,填写配置组名称,单击“确定”。如下图所示:
各个参数的说明如下图所示:
保存完成后,mppdb概览里会显示配置状态为过期配置,立即重启mppdb服务即可。另外,上传的文件位置位于${BIGDATA_HOME}/mppdb/hdfs_conf下面。
使用omm用户,登录数据库执行下面的操作创建外表server。
[omm@hd01 ~]$ source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile
[omm@hd01 ~]$ gsql -d rhnschema -p 25308 -r
rhnschema=# create server server_test foreign data wrapper hdfs_fdw options(address ‘192.168.110.35:25000,192.168.110.36:25000‘,hdfscfgpath ‘/opt/huawei/Bigdata/mppdb/hdfs_conf/FHD/candon@HADOOP.COM‘,type ‘HDFS‘);
CREATE SERVER
可以使用下面的SQL查询已创建的server信息:
rhnschema=# select *from pg_foreign_server where srvname=‘server_test‘;
rhnschema=# create foreign table f_a (id int,name text) server server_test options(format ‘orc‘,foldername ‘/user/hive/warehouse/hivedb.db/a‘) distribute by roundrobin;
CREATE FOREIGN TABLE
创建外表的语法如下图所示:
rhnschema=# select *from f_a;
标签:读取 选项 sig _for ORC orm srv text file
原文地址:https://blog.51cto.com/candon123/2458043