hive OpenCSVSerde

OpenCSVSerDe

1.如果数据包含使用双引号 (") 括起的值(如果你的数据不含有“”中的值,那么可以使用row format delimited ,即默认的 LazySimpleSerDe
2.您的数据具有 UNIX 数字 TIMESTAMP 值 (时间戳)

create table tab_name (element element_type...) row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde' with serdeproperties(
"separatorChar" = ",", #分隔符
"quoteChar" = "`", #引用
"escapeChar" = "\") #转义符

  • \t 或 \n 无法直接转义。要对它们进行转义,请使用 "escapeChar" = "\"。

  • 不支持 CSV 文件中的嵌入换行符。

  • OpenCSVSerDe 不支持采用 JDBC 兼容 java.sql.Timestamp 格式的 TIMESTAMP,例如 "YYYY-MM-DD HH:MM:SS.fffffffff"(9 位小数精度)。

忽略标题

TBLPROPERTIES ("skip.header.line.count"="1")

posted @ 2023-04-07 10:50  lyw2004  阅读(338)  评论(0)    收藏  举报