关于JAVA乱码问题

今天刺激了一天。。总算是将JAVA乱码问题解决了。

问题基本如下。

Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER。那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。如果这个'\xef\xbf\xbd',重复多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话就是“锟斤拷——锟(0xEFBF),斤(0xBDEF),拷(0xBFBD)”。

基本上涉及到了URL转码和下载的时候转码的问题。

以下转自:http://blog.csdn.net/wula0010/article/details/3942321

jsp乱码问题,大家经常碰到,我在做多文件上传的过程中,基本碰到了所有的情况,解决也是曲折的,经过摸索,现在总结如下:

1、所有页面都用统一的编码UTF-8(或GB2312或GBK)。 
2、写过滤器,设置request.setCharacterEncoding("UTF-8")。 
3、javascript脚本里用传参数要先encodeURI(str)编码。 
4、适当的时候,在jsp里用java.net.URLDecoder.decode(request.getParameter("str"),"UTF-8")解码。 
5、最容易忽略的是在jsp页面使用".....":value=" <%=paraFiles%>",一定要有引号。

6、文件下载的时候,response.setHeader的文件名要转换编码,读取文件的路径不要转换编码。

public static String toUtf8String(String s) {
StringBuffer sb = new StringBuffer();
for (int i = 0; i < s.length(); i++) {
char c = s.charAt(i);
if (c >= 0 && c <= 255) {
sb.append(c);
} else {
byte[] b;
try {
b = Character.toString(c).getBytes("utf-8");
} catch (Exception ex) {
System.out.println(ex);
b = new byte[0];
}
for (int j = 0; j < b.length; j++) {
int k = b[j];
if (k < 0) {
k += 256;
}
sb.append("%" + Integer.toHexString(k).
toUpperCase());
}
}
}
return sb.toString();
}

String fileName=request.getParameter("filename");
String contextPath=request.getSession().getServletContext().getRealPath("");
String filePath=contextPath+"//"+InitParameter.getUploadFile_Path()+"//";
File file=new File(filePath+fileName);


String fileName1=toUtf8String(fileName);
response.setContentType("application/octet-stream");
response.setContentType("application/OCTET-STREAM;charset=UTF-8");
response.setHeader("Content-Disposition", "attachment;filename="+fileName1);

 

  

posted @ 2015-05-28 21:13  小宝陛下  阅读(333)  评论(0)    收藏  举报