摘要: 1:简单判断是UTF-8或不是UTF-8,因为一般除了UTF-8之外就是GBK,所以就设置默认为GBK。 按照给定的字符集存储文件时,在文件的最开头的三个字节中就有可能存储着编码信息,所以,基本的原理就是只要读出文件前三个字节,判定这些字节的值,就可以得知其编码的格式。其实,如果项目运行的平台就是中文操作系统,如果这些文本文件在项目内产生,即开发人员可以控制文本的编码格式,只要判定两种常见的编码就可以了:GBK和UTF-8。由于中文Windows默认的编码是GBK,所以一般只要判定UTF-8编码格式。 对于UTF-8编码格式的文本文件,其前3个字节的值就是-17、-69、-65,所以,判定.. 阅读全文
posted @ 2013-02-20 18:38 IT_熊 阅读(3017) 评论(0) 推荐(1)
摘要: 今天遇到一个将java二进制文件(.class)用jad进行反编译,因为操作是在windows上操作,反编译后的文件编码是GBK编码,因为开发运行环境是utf-8,需将GBK编码文件转化为utf-8,又因为文件目录及数量很多,单个处理比较麻烦,特花十几分钟编写工具类如下以记录之:import java.io.ByteArrayInputStream; import java.io.ByteArrayOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundExcep 阅读全文
posted @ 2013-02-20 18:24 IT_熊 阅读(304) 评论(0) 推荐(0)