Sqoop导入导出——hive＜=＞mysql

2023-03-25 10:28:03

Mysql通过sqoop导入到hdfs，hive建表导入hdfs路径的数据，hive通过sqoop导出到mysql。

导出：

sqoop 推送mysql数据到hive中：

sqoop export 
--connect "jdbc:mysql://localhost:3306/hoteldata?useUnicode=true&characterEncoding=utf-8" 
--username root 
--password root 
--table rawdata 
--input-fields-terminated-by "," -
--export-dir "/user/hive/warehouse/hoteldata.db/rawdata"

将hive的数据导出到mysql:是通过hdfs中的路径导入到mysql中。

导入：

如果mysql中的表没有主键,需要指定–split-by

sqoop  import 
--connect "jdbc:mysql://192.168.3.25:3306/jd_hotel" 
--username root 
--password 123456 
--table tbl_hotel
 --target-dir /h3c/s3/jd_hotel  
 --split-by id

导出分隔符：

–fields-terminated-by ‘|’

–lines-terminated-by '\n’

解析数字时遇到了None,在pyspark里导出来的空值可能是被替换成None.

–input-null-string ‘None’ --input-null-non-string ‘None’ 通过这个参数指定None作为空的值

–split-by id 划分id自动分成n个map来进行数据导入

Sqoop导入导出——hive＜=＞mysql

Mysql通过sqoop导入到hdfs，hive建表导入hdfs路径的数据，hive通过sqoop导出到mysql。

导出：

导入：

继续阅读

mysql优化（sql优化）

数据迁移方法数据迁移原则数据迁移之双写方案数据迁移之级联同步方案

redis集群数据一致性_RedisRaft为Redis集群带来强大的数据一致性

宝塔面板mysql恢复2018.1.8更新

Centos7 MySQL 5.7 安装MySQL 5.7 安装

线程同步，可重入锁，synchronized

查找入职员工时间排名倒数第三的员工所有信息

Hibernate使用Hibernate的“3个准备，7个步骤”Hibernate API简介操作实体对象对象识别

云计算面试题——mysql/存储引擎/备份

SQL语言基础：常用的数据查询语句

Ubuntu16.04安装Apache+MySQL+PHP1. 安装Apache2. 安装MySQL3. 安装PHP4. 安装phpMyAdmin

MySQL的4种隔离级别？出现问题

对象锁和全局锁

neo4j之cypher使用文档

iview后台管理模版

mysql使用source命令导入.sql文件