字符集与字符编码的一些小常识,以及java web中文乱码的一些solution

字符集:Unicode,字符编码:UTF-8

UTF-8:一个字节0SXSXSXS

二个字节:110SXSXS 10SXSXSX

三个字节:1110SXSX 10SXSXSX 10SXSXSX

由于unicode不兼容gb2312等等字符集编码,那么需要codepage来映射,

Gb2312codepage936

Unicodecodepoage65001

1)post乱码:在调用request.getParameter之前调用,request.setCharacterEncoding("UTF-8"),或者增加一个过滤器,加请求参数进行字符编码过滤

2)get乱码:设置tomcat服务器配置文件server.xml在context中增加一个属性URIEncoding="UTF-8"

3)jsp页面内编辑时:在右上角ISO-8859-1改成UTF-8或者在window->preference->myeclipse->files and editor->jsp改成UTF-8这样新建的jsp都是UTF-8

4)*.properties文件中文乱码:native2ascii.exe或者用myeclipse的properties文件编辑器即可

posted @ 2011-09-26 00:28  F.N.  阅读(301)  评论(0编辑  收藏  举报