雕刻时光

just do it……nothing impossible
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

Tomcat中文编码-转

Posted on 2014-09-22 10:58  huhuuu  阅读(223)  评论(0)    收藏  举报

本来以为把jsp页面设置为UTF-8,服务器端用filter把request和response设置为utf-8,中文问题应该就差不多了。

但tomcat似乎中间给我我们加了步骤。

1 页面

页面中设置的编码,我们post的数据就会按照页面的编码进行 encode,

比如 我们要post数据为 site=博客园,如果我们的页面为utf-8格式,

则实际post的数据为 site=%E5%8D%9A%E5%AE%A2%E5%9B%AD

java:URLEncoder.encode("博客园", "utf-8"),

所以我们post给服务器的数据会先经过页面编码的encode。

2 tomcat服务器

当我们直接 request.getParameter(“site”);发现得到的字符串为“?????????”,

因为tomcat自作聪明的把的字符串当成iso8859-1来解码了,

tomcat执行了类似:URLDecoder.decode(str, "iso8859-1");,因为jsp页面默认的编码就是iso8859-1,

就算你改了myeclipse的jsp页面默认编码,但tomcat的还是iso8859-1。

3 servlet

我们的servlet如何得到中文编码呢?我们一步一步的加码解码即可:

URLEncoder.encode(str, "iso8859-1");//把tomcat给我们解码的字符串给加码上

URLDecoder.decode(str, "utf-8");//把浏览器给我们加码的数据解码

 

总体过程:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
//页面 pageEncoding=utf-8
String str = "博客园";
str = URLEncoder.encode(str, "utf-8");
System.out.println(str);
//output:%E5%8D%9A%E5%AE%A2%E5%9B%AD
 
//tomcat
str = URLDecoder.decode(str, "iso8859-1");
System.out.println(str);
//output:?????????
 
// servlet
str = URLEncoder.encode(str, "iso8859-1");
System.out.println(str);//%E5%8D%9A%E5%AE%A2%E5%9B%AD
str = URLDecoder.decode(str, "utf-8");
System.out.println(str);//博客园

 

知道了tomcat加码解码过程,我们就可以彻底设置解码方式了。

如果是get方式传数据,可以设置解码方式,

在tomcat的server.xml中 connector加上解码方式:

1
2
3
<Connector port="8000" protocol="HTTP/1.1" URIEncoding="UTF-8"
           connectionTimeout="20000"
           redirectPort="8443" />

post还是使用filter + 手动解码吧!

作者:syxChina
出处:http://syxchina.cnblogs.com、 http://hi.baidu.com/syxcs123 
本文版权归作者、博客园和百度空间共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则作者会诅咒你的。
如果您阅读了我的文章并觉得有价值请点击此处,谢谢您的肯定1。