使用kafka consumer api时,中文乱码问题

使用Intelli idea调试kafka low consumer时,由于broker存储的message有中文,

idea中console端是可以正确显示的

然后mvn package打包到服务器上执行,结果中文乱码。

然后在kafka consumer代码中byte转为string时,使用了各种编码

String mes = new String(bytes,"UTF-8");
String mes = new String(bytes,"GBK");
String mes = new String(bytes,"iso8859-1");

问题还是没有解决。然后一直google,摆渡,看到有人说到jvm的默认编码会影响程序的编码,于是在程序中把

Charset.defaultCharset()打印出来,结果,在idea中显示的是UTF-8,在服务器上执行时就变成了US-ASCII。

我整个工程都是以UTF-8编码的,难怪在服务器上中文会乱码了。问题找到了,然后又经过一番折腾,终于解决了问题

在/etc/profile添加HADOOP_OPT="-Dfile encoding=UTF-8",保存退出 source /etc/profile,重新执行

hadoop jar kafkaHdfs-1.0-SNAPSHOT-jar-with-dependencies.jar org.conan.kafka.AllTopicsConsumer ./hdfs.properties

 

posted on 2014-10-24 18:36  超大杯摩卡星冰乐  阅读(15003)  评论(2编辑  收藏  举报

导航