关于JAVA乱码问题

今天刺激了一天。。总算是将JAVA乱码问题解决了。

问题基本如下。

Unicode和老编码体系的转化过程中，肯定有一些字，用Unicode是没法表示的，Unicode官方用了一个占位符来表示这些文字，这就是：U+FFFD REPLACEMENT CHARACTER。那么U+FFFD的UTF-8编码出来，恰好是 '\xef\xbf\xbd'。如果这个'\xef\xbf\xbd'，重复多次，例如 '\xef\xbf\xbd\xef\xbf\xbd'，然后放到GBK/CP936/GB2312/GB18030的环境中显示的话就是“锟斤拷——锟(0xEFBF)，斤（0xBDEF），拷（0xBFBD）”。

基本上涉及到了URL转码和下载的时候转码的问题。

以下转自：http://blog.csdn.net/wula0010/article/details/3942321

jsp乱码问题，大家经常碰到，我在做多文件上传的过程中，基本碰到了所有的情况，解决也是曲折的，经过摸索，现在总结如下：

1、所有页面都用统一的编码UTF-8(或GB2312或GBK)。
2、写过滤器，设置request.setCharacterEncoding("UTF-8")。
3、javascript脚本里用传参数要先encodeURI(str)编码。
4、适当的时候，在jsp里用java.net.URLDecoder.decode(request.getParameter("str"),"UTF-8")解码。
5、最容易忽略的是在jsp页面使用"....."：value=" <%=paraFiles%>"，一定要有引号。

6、文件下载的时候，response.setHeader的文件名要转换编码，读取文件的路径不要转换编码。

public static String toUtf8String(String s) {
StringBuffer sb = new StringBuffer();
for (int i = 0; i < s.length(); i++) {
char c = s.charAt(i);
if (c >= 0 && c <= 255) {
sb.append(c);
} else {
byte[] b;
try {
b = Character.toString(c).getBytes("utf-8");
} catch (Exception ex) {
System.out.println(ex);
b = new byte[0];
}
for (int j = 0; j < b.length; j++) {
int k = b[j];
if (k < 0) {
k += 256;
}
sb.append("%" + Integer.toHexString(k).
toUpperCase());
}
}
}
return sb.toString();
}

String fileName=request.getParameter("filename");
String contextPath=request.getSession().getServletContext().getRealPath("");
String filePath=contextPath+"//"+InitParameter.getUploadFile_Path()+"//";
File file=new File(filePath+fileName);


String fileName1=toUtf8String(fileName);
response.setContentType("application/octet-stream");
response.setContentType("application/OCTET-STREAM;charset=UTF-8");
response.setHeader("Content-Disposition", "attachment;filename="+fileName1);

posted @ 2015-05-28 21:13 小宝陛下阅读(333) 评论(0) 收藏举报

刷新页面返回顶部

关于JAVA乱码问题

公告