摘要: 1)数据由一行变成两行,导致输出到Hive表数据缺失。 处理:在源头上处理下字段内容,将空格,\n等一些特殊字符处理掉 TRIM(BOTH FROM replace(o.refund_reason,'\n','')) as refund_reason 阅读全文
posted @ 2020-09-23 18:03 楔子 阅读(184) 评论(0) 推荐(0)
摘要: 1. read_excelread_excel方法定义: pandas.read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, usecols=None, par 阅读全文
posted @ 2020-09-23 16:20 楔子 阅读(883) 评论(0) 推荐(0)
摘要: python中导入自定义模块的方法: 1、py执行文件和模块同属于同个目录(父级目录) 直接使用 import <模块名>命令导入模块,然后使用模块.变量|函数语句即可使用模块中的函数。 2、先使用sys模块导入自定义模块的路径,然后使用import导入模块 导入步骤: 1、使用import sys 阅读全文
posted @ 2020-09-23 14:36 楔子 阅读(465) 评论(0) 推荐(0)