随笔分类 -  Hive学习

摘要:HiveQL:数据定义 1. Hive中的数据库 Hive中数据库本质为表的一个目录或者命名空间 建库: ~~~. hive CREATE DATABASE [IF NOT EXISTS] finacials; ~~~ Hive会为每个数据库创建一个目录,数据库中的表将会以这个数据库目录的子目录形式 阅读全文
posted @ 2019-11-13 18:01 ganshuoos 阅读(195) 评论(0) 推荐(0)
摘要:Hive中问题解决整理 1.处理中文字段时多个join过程中出现字段偏移 原因:如果字段存在 '|' 或者 '\n' 或者 '\r' 时,都会产生错位 对于中文字段或者含有特殊字符的字段,进行筛选时,可以使用 regexp_replace(A, '\\||\\\\n|\\\\r|\\\\t', '' 阅读全文
posted @ 2019-11-04 16:34 ganshuoos 阅读(228) 评论(0) 推荐(0)
摘要:Hive 数据类型和文件格式 1. 基本数据类型 | 数据类型 | 长度 | 例子 | | | | | | TINYINT | 1byte有符号整数 | 20 | | SMALINT | 2byte有符号整数 | 20 | | INT | 4byte有符号整数 | 20 | | BIGINT | 8 阅读全文
posted @ 2019-11-01 10:22 ganshuoos 阅读(127) 评论(0) 推荐(0)