hive中文注释乱码解决方案

hive中文注释乱码解决方案:

一开始建表时后面的comment都是写的中文,但是因为建表解析的原因,最终显示的时候红色框住部分全部都是问号。

而理想状态应该是这样

查阅资料发现下面两种方法可以进行修改建表解析方式

①在Hive元数据存储的Mysql数据库中,执行以下SQL:

#修改字段注释字符集
alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;
#修改表注释字符集
alter table TABLE_PARAMS modify column PARAM_VALUE varchar(20000) character set utf8;
#修改分区参数,支持分区建用中文表示
alter table PARTITION_PARAMS modify column PARAM_VALUE varchar(20000) character set utf8;
alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(20000) character set utf8;
#修改索引名注释,支持中文表示
alter table INDEX_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
#修改视图,支持视图中文
ALTER TABLE TBLS modify COLUMN VIEW_EXPANDED_TEXT mediumtext CHARACTER SET utf8;
ALTER TABLE TBLS modify COLUMN VIEW_ORIGINAL_TEXT mediumtext CHARACTER SET utf8;

②修改hive-site.xml中Hive读取元数据的编码

 <property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:mysql://hadoop103:3306/metastore?createDatabaseIfNotExist=true&amp;useUnicode=true&amp;characterEncoding=UTF-8<
/value>
</property>

但由于自己已经把数据导入到表中,所以对删除表还是有点顾虑

进行了一些修复,但是已经建立的表就没法了,需要重新删除表,在进行修复

修复语句:

msck repair table_name info

所幸大部分表都是外部表,删除表并不删除数据,进行上面语句,基本恢复

posted @ 2021-11-22 21:29  KaneQi  阅读(346)  评论(0编辑  收藏  举报