摘要:
1:简单判断是UTF-8或不是UTF-8,因为一般除了UTF-8之外就是GBK,所以就设置默认为GBK。 按照给定的字符集存储文件时,在文件的最开头的三个字节中就有可能存储着编码信息,所以,基本的原理就是只要读出文件前三个字节,判定这些字节的值,就可以得知其编码的格式。其实,如果项目运行的平台就是中文操作系统,如果这些文本文件在项目内产生,即开发人员可以控制文本的编码格式,只要判定两种常见的编码就可以了:GBK和UTF-8。由于中文Windows默认的编码是GBK,所以一般只要判定UTF-8编码格式。 对于UTF-8编码格式的文本文件,其前3个字节的值就是-17、-69、-65,所以,判定.. 阅读全文
posted @ 2013-02-20 18:38
IT_熊
阅读(3017)
评论(0)
推荐(1)
摘要:
今天遇到一个将java二进制文件(.class)用jad进行反编译,因为操作是在windows上操作,反编译后的文件编码是GBK编码,因为开发运行环境是utf-8,需将GBK编码文件转化为utf-8,又因为文件目录及数量很多,单个处理比较麻烦,特花十几分钟编写工具类如下以记录之:import java.io.ByteArrayInputStream;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundExcep 阅读全文
posted @ 2013-02-20 18:24
IT_熊
阅读(304)
评论(0)
推荐(0)

浙公网安备 33010602011771号