sqoop 基本使用
sqoop的主要功能是导入和导出
- 导入
- 读数据(row-by-row)
- 并行化执行
- 导入的结果可以是文本文件或者二进制序列化文件
- 导出
- 并行化读取HDFS文件
基本操作
sqoop实质上是一个工具箱,使用的时候需要指定哪个工具和控制工具的参数。
- 通过sqoop help,来查看sqoop支持哪些命令
1 | sqoop help |
- 查看某个命令的具体使用
查看import
如何使用
1 | (base) peter:sqoop-1.4.7 piqianchao$ sqoop help import |
使用demo
- 直接使用参数传递
- 使用文件方式进行参数的传递:文件中允许空行和注释部分
1 | 1. 直接使用 |
1 | 2. 将参数写入文件中 |