码迷,mamicode.com
首页 > 其他好文 > 详细

20180611早课记录28-Sqoop

时间:2018-06-11 14:50:58      阅读:121      评论:0      收藏:0      [点我收藏+]

标签:Hadoop   Sqoop   

1.sqoop是什么?

主要用于在Hadoop与RDBMS间进行数据的传递

2.sqoop分为哪两个分支,各最新版本是什么?

sqoop1:1.4.7
sqoop2:1.99.7

3.在工作中我们用的最多的是sqoop1,那么导入和导出,谁给谁的

导入是RDBMS到Hadoop
导出是Hadoop到RDBMS

4.假如输入一个命令找不到not found,你们觉得该怎么办?(老生常谈)

先看打错了没有,再看PATH有没有,或者yum安装

5.sqoop命令参数-m是什么意思

指定MapReduce的数量

6.sqoop 想要把MySQL数据导到hive里,那么是不是要加mysql jdbc jar包?

需要

7.sqoop导入,我能不能直接写SQL的导?

可以 --query指定

8.sqoop会有reduce job吗

不会

9.假如让你们项目作业的sqoop 每天导数据到hive分区表里,用shell脚本和crontab,有没有信心完成?

还要练习

20180611早课记录28-Sqoop

标签:Hadoop   Sqoop   

原文地址:http://blog.51cto.com/10814168/2128005

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!