> 文章列表 > Sqoop 安装部署

Sqoop 安装部署

Sqoop 安装部署

文章目录

  • Sqoop 安装部署
    • 一、安装 sqoop
    • 二、修改配置文件
      • 1、重命名配置文件
      • 2、修改配置文件
    • 三、测试验证
      • 1、测试
      • 2、测试Sqoop是否能够成功连接数据库
    • 四、mysql 数据导入到 hdfs

Sqoop 安装部署

一、安装 sqoop

sqoop 下载地址:https://archive.apache.org/dist/sqoop/1.4.7/
我们的hadoop3.13 版本的,对应的sqoop是1.4.7,我们下1.4.7版本的就行了。
Sqoop 安装部署
上传到 linux 的 /opt/software 目录下
Sqoop 安装部署
接下来解压到,/opt 目录下
输入命令: tar -zxvf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz -C /opt/
Sqoop 安装部署
输入命令: mv sqoop-1.4.7.bin__hadoop-2.6.0/ sqoop 把名字改为sqoop
Sqoop 安装部署

二、修改配置文件

Sqoop的配置文件与大多数大数据框架类似,在sqoop根目录下的conf目录中

1、重命名配置文件

输入命令: mv sqoop-env-template.sh sqoop-env.sh
Sqoop 安装部署

2、修改配置文件

输入命令:vim sqoop-env.sh 添加如下配置

export ZOOKEEPER_HOME=/opt/zookeeper
export HADOOP_COMMON_HOME=/opt/hadoop-3.1.3
export HADOOP_MAPRED_HOME=/opt/hadoop-3.1.3
export HIVE_HOME=/opt/hive
export ZOOKEEPER_HOME=/opt/zookeeper
export ZOOCFGDIR=/opt/zookeeper

然后把 mysql 的驱动,拷贝到 sqoop 的 lib 目录下就可以了

三、测试验证

1、测试

输入命令:bin/sqoop help 可以看到命令提示
Sqoop 安装部署

2、测试Sqoop是否能够成功连接数据库

输入命令:bin/sqoop list-databases --connect jdbc:mysql://hadoop102:3306/ --username root --password p@ssw0rd 可以看到已经连接成功了
Sqoop 安装部署

四、mysql 数据导入到 hdfs

输入代码: 下面是语法格式,前面四行都是与mysql相关的,下面是哪行就是与 hdfs 相关的

bin/sqoop import \\   --导入
--connect jdbc:mysql://hadoop102:3306/shtd_store \\  --mysql数据库连接
--username root \\			-- 用户
--password p@ssw0rd \\       --密码
--table user_info \\         --表名
--target-dir /user/dates \\	--hdfs 文件地址
--delete-target-dir \\   --如果有这个文件就删除,在公司里就不要用了,测试的时候还可以
--num-mappers 1 \\			--mappers 数量 
--fields-terminated-by "\\t"  --数据的分割符