随笔分类 -  Sqoop

摘要:1)数据由一行变成两行,导致输出到Hive表数据缺失。 处理:在源头上处理下字段内容,将空格,\n等一些特殊字符处理掉 TRIM(BOTH FROM replace(o.refund_reason,'\n','')) as refund_reason 阅读全文
posted @ 2020-09-23 18:03 楔子 阅读(185) 评论(0) 推荐(0)
摘要:mysql数据库里面的字段是 tinyint 类型通过sqoop 抓取出来的数据在HDFS 上面显示的true、false解决办法:jdbc会把tinyint 认为是java.sql.Types.BIT,然后sqoop就会转为Boolean了在连接上加上一句话tinyInt1isBit=falsej 阅读全文
posted @ 2020-08-25 09:52 楔子 阅读(462) 评论(0) 推荐(1)
摘要:说明:使用shell脚本增量调度至hive表。 操作步骤 1、使用sqoop蒋mysql数据调度到hive临时表tmp_bst_bas_dy_orders 2、将临时表中的数据覆盖写如hive对应分区内 临时表数据未压缩,以传统txt方式存取,hive表采用orc压缩,均为外部表,按年月日进行分区。 阅读全文
posted @ 2019-12-04 11:18 楔子 阅读(182) 评论(0) 推荐(0)
摘要:1)从mysql中导入数据至hdfs指定目录 sqoop import --connect jdbc:mysql://${db_ip}:${db_port}/${db_database}?serverTimezone=Asia/Shanghai --username ${db_user} --pas 阅读全文
posted @ 2019-12-04 11:08 楔子 阅读(218) 评论(0) 推荐(0)