代码改变世界

hive中修改序列化格式分隔符

 

标签: hadoophivealtertable
 分类:

SerDe

SerDe 是 Serialize/Deserilize 的简称,目的是用于序列化和反序列化。序列化的格式包括:

  • 分隔符(tab、逗号、CTRL-A)
  • Thrift 协议

反序列化(内存内):

  • Java Integer/String/ArrayList/HashMap
  • Hadoop Writable 类
  • 用户自定义类
查看表结构方法有两种:
  1. desc tableName
  2. desc formatted tableName
修改表中的序列化分隔符:
[plain] view plain copy
 
  1. hive> alter table store set SERDEPROPERTIES('field.delim'='\t');  

参考资料:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-AlterTableProperties

 

posted on 2017-09-14 11:32  Captain林  阅读(2725)  评论(0编辑  收藏  举报

导航