1 Hive注释comment出现乱码
1.1 Hive建表语句
create table test.mytest_tm1(
id int comment'编号',
name string comment '名字'
)
row format delimited fields terminated by '\u0001'
lines terminated by '\n'
stored as textfile;
1.2 Hive的元数据存在Mysql中,而Mysql字符集的默认Latin1,则会出现乱码
2 修改Mysql字符集 latin1 改成 utf-8
在hive库里面修改表、分区、视图
2.1 修改表字段注解和表注解
use hive;# mysql元数据库
alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;
alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
2.2 修改分区字段注解
alter table PARTITION_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8 ;
alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8;
2.3 修改索引注解
alter table INDEX_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
3 在ambari的UI页面修改 metastore 的连接 URL
注意修改完成后要重启Hive
jdbc:mysql://ip:3306/database?createDatabaseIfNotExist=true&useUnicode=true&characterEncoding=UTF-8
4 验证结果
注意:必须是新建hive表,旧表字符集已经不可改变。
网友评论