码迷,mamicode.com
首页 > 其他好文 > 详细

Sqoop操作集合

时间:2018-07-10 19:14:58      阅读:149      评论:0      收藏:0      [点我收藏+]

标签:pass   完成   rmi   username   rom   sel   dfs   分区   select   

1.在hive中建一个与mysql中一模一样的表

sqoop create-hive-table --connect jdbc:mysql://***.**.***.**:3306/数据库名称  --table 表名 --username root --password root --hive-partition-key 分区名称 --hive-table hive中的表名

2.在1完成后,自由导数到hive:

sqoop import  --connect jdbc:mysql://***:3306/数据库  --username root --password root  --query "SELECT * from hive_cc_daas_insurance_sales  where pt=$value  and \$CONDITIONS  limit 1000"  --target-dir /tmp/hive_cc_daas_insurance_sales --hive-table db_bi.hive_cc_daas_insurance_sales --hive-import --m 1 --hive-partition-key 分区名称 --hive-partition-value 分区值 

其中
a.$CONDITIONS 是必须的,具体原理可以百度。
b.--target-dir /tmp/hive_cc_daas_insurance_sales 指的是从mysql中的数据放到hdfs的哪部分上(Sqoop导数mysql->hdfs->hive)
c.1中的--hive-partition-key必须和2中的hive-partition-key,hive-partition-value同时存在或不存在
d.--fields-terminated-by ‘,‘ mysql中的字段存储在HDFS上时,以,分割

Sqoop操作集合

标签:pass   完成   rmi   username   rom   sel   dfs   分区   select   

原文地址:https://www.cnblogs.com/WinseterCheng/p/9290861.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!