jsp include html 乱码问题

感谢大佬:https://blog.csdn.net/sessionsong/article/details/38778853

在使用<%@ include page=""%> 指令包含一个html页面(b.html)时中文乱码。 乱码问题 首先想到的就是这两个文件的编码是否统一

在仔细检查了一遍后 发现没问题 都是UTF-8的。 既能编码一致 那为什么还好出现乱码呢。

于是就把html的内容重新放到一个jsp文件(c.jsp)中去 inlude 该jsp文件 没无问题 正常 显示 那是啥问题了 ⊙﹏⊙b汗

也是 仔细比较了b.html 和c.jsp 文件 发现这两个文件 除了meta标签里面的内容不同的话 就是 c.jsp 文件比b.html 多了行代码

<%@ page language=“java” contentType=“text/html; charset=UTF-8” pageEncoding=“UTF-8”%>

是不是和这有关呢 把这复制到b.html 页面中 刷新 中文正常显示了 Ooo

问题是解决了 但是为啥呢 得仔细分析分析 <%@ page language=“java” contentType=“text/html; charset=UTF-8” pageEncoding=“UTF-8”%> 这行代码了

这行代码中有两个指定编码格式的指令 charset 和 pageEncoding 其中 html页面的中已经有了 charset 所以 这行代码可以简写为

<%@ page language="java"  pageEncoding="UTF-8"%> 

下面我们分析下 pageEncoding和contentType两种属性的区别:

  • 1)pageEncoding是jsp文件本身的编码
  • 2)contentType的charset是指服务器发送给客户端时的内容编码

jsp 从用户发送请求到相应给用户中间要经历三个阶段

  1. 一:jsp编译成.java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8
    JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。
  2. 二:是由JAVAC的JAVA源码至java
    byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。
    JAVAC用UTF-8的encoding读取java源码,编译成UTF-8
    encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。
  3. 三: Tomcat(或其的application
    container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效

而include指令就是在第一阶段之前执行的,注意这个是在第一阶段之前,所以,如果包含文件和被包含文件的文件编码不一致,那么,该指令就会工作不太正常,不能正确的把被包含的文件从原来编码转换为包含文件的编码,就会出现乱码现象.

所以这时候得指定html页面的pageEncoding 属性 虽能html文件不识别这个属性 但是最后include到jsp文件中 他会发挥作用的。

没有设置<%@ page language=“java” pageEncoding=“UTF-8”%>属性的时候

页面源码:

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<title>Insert title here</title>
</head>
<body>
b.html   中文乱码问题  未加 pageEncoding="UTF-8"%
</body>
</html>

include 到jsp页面后运行的效果在这里插入图片描述
生成的java文件部分代码
在这里插入图片描述
在html页面加入<%@ page language=“java” pageEncoding=“UTF-8”%>后

源码:

<%@ page language="java"  pageEncoding="UTF-8"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<title>Insert title here</title>
</head>
<body>
b.html   中文乱码问题  未加 pageEncoding="UTF-8"%
</body>
</html>

运行效果
在这里插入图片描述
生成的java文件部分代码
在这里插入图片描述
都正常显示。

网上还有一种方法 就是修改项目的web.xml 文件 在web-app标签中加入如下内容

  <jsp-config>
<jsp-property-group>
<description>html encoding example</description>
<display-name>JSPConfiguration</display-name>
<url-pattern>*.html</url-pattern>
<el-ignored>true</el-ignored>
<page-encoding>UTF-8</page-encoding>
<scripting-invalid>false</scripting-invalid>
<include-prelude></include-prelude>
<include-coda></include-coda>
</jsp-property-group>
</jsp-config>

重新部署下项目就好了

其实仔细观察代码 他也是设置include的html/jsp页面的编码。思路是一样的。

我的理解:

  1. 解决方法一:在被include的html页面首行添加:<%@page pageEncoding="utf-8"%>
  2. 解决方法二:在项目的WebRoot下的WEB-INF夹中打开web.xml配置文件,在配置文件的<web-app></web-app>标签之间加入以下配置,可解决include过程中的中文乱码问题。
    在 Tomcat 5.0.x 中,Tomcat 支持了 JSP 2.0 的规格,同时也支持了部分 J2EE 1.4 的规格,在 J2EE 1.4 的规格中,有关 JSP 的部份,有一个 <jsp-config> 的 XML Tag,这个 XML 区块用来定义与 JSP 相关的特殊属性,包含采用的 taglib 与 以下说明的 <jsp-property-group> ,而解决 include 档中文问题的方法就定义在 <jsp-roperty-group> 中。
<jsp-config>
    <jsp-property-group>   
        <description>      
            Special property group for JSP Configuration JSP example.   
        </description>
        <display-name>JSPConfiguration</display-name>
        <url-pattern>*.jsp</url-pattern>
        <el-ignored>true</el-ignored>
        <page-encoding>gb2312</page-encoding>
        <scripting-invalid>false</scripting-invalid>
        <include-prelude></include-prelude>
        <include-coda></include-coda>
    </jsp-property-group>
    
    
    <jsp-property-group>   
        <description>      
            Special property group for JSP Configuration JSP example.   
        </description>
        <display-name>JSPConfiguration</display-name>
        <url-pattern>*.htm</url-pattern>
        <el-ignored>true</el-ignored>
        <page-encoding>gb2312</page-encoding>
        <scripting-invalid>false</scripting-invalid>
        <include-prelude></include-prelude>
        <include-coda></include-coda>
    </jsp-property-group>
    
    <jsp-property-group>   
        <description>      
            Special property group for JSP Configuration JSP example.   
        </description>
        <display-name>JSPConfiguration</display-name>
        <url-pattern>*.html</url-pattern>
        <el-ignored>true</el-ignored>
        <page-encoding>gb2312</page-encoding>
        <scripting-invalid>false</scripting-invalid>
        <include-prelude></include-prelude>
        <include-coda></include-coda>
    </jsp-property-group>
    
    
    <jsp-property-group>   
        <description>      
            Special property group for JSP Configuration JSP example.   
        </description>
        <display-name>JSPConfiguration</display-name>
        <url-pattern>*.txt</url-pattern>
        <el-ignored>true</el-ignored>
        <page-encoding>gb2312</page-encoding>
        <scripting-invalid>false</scripting-invalid>
        <include-prelude></include-prelude>
        <include-coda></include-coda>
    </jsp-property-group>
    
    </jsp-config>

其中jsp-config一段是用来说明你要将包含的页面默认按照什么编码格式包含。web-app 标签的version必须是2.4的。

附带说明:

<jsp-config> 元素主要用来设定JSP 相关配置

<jsp-config> 包括<taglib><jsp-property-group> 两个子元素。

<taglib>元素在JSP 1.2 时就已经存在;
<jsp-property-group>是JSP 2.0 新增的元素:
<jsp-property-group>元素主要有八个子元素,它们分别为:
<description>:设定的说明;
<display-name>:设定名称;
<url-pattern>:设定值所影响的范围,如: /*.jsp;
<el-ignored>:若为true,表示不支持EL 语法;
<scripting-invalid>:若为true,表示不支持<% scripting %>语法;
<page-encoding>:设定JSP 网页的编码;
<include-prelude>:设置JSP 网页的抬头,扩展名为.jsp
<include-coda>:设置JSP 网页的结尾,扩展名为.jsp

自定义的tag也需要放在<jsp-config>中间

<jsp-config>     
  <taglib>     
    <taglib-uri>Taglib</taglib-uri>     
    <taglib-location>/WEB-INF/tlds/MyTaglib.tld</taglib-location>     
  </taglib>
</jsp-config> 

二者功能相同,区别一个是一次性的,一个是要逐页写的。

补充:Post与Get方式传递参数乱码问题

1. post

request.setChracterEncoding("charset");

注意:这种方式却对Get请求没用,只对Post方式提交的有效!!

原因是,自从Tomcat5.x开始,GET和POST方法提交的信息,Tomcat采用了不同的方式来处理编码,对于POST请求,Tomcat会仍然使用request.setCharacterEncoding方法所设置的编码来处理,如果未设置,则使用默认的iso-8859-1编码。而GET请求则不同,Tomcat对于GET请求并不会考虑使用request.setCharacterEncoding方法设置的编码,而会永远使用iso-8859-1编码。

2. get

方式一:在Tomcat目录conf下修改server.xml,添加URIEcoding=“charset”

<Connector URIEncoding=“UTF-8”   
           port=“8080”   maxHttpHeaderSize=“8192”  
           maxThreads=“150” minSpareThreads=“25” maxSpareThreads=“75”  
           enableLookups=“false” redirectPort=“8443” acceptCount=“100”  
           connectionTimeout=“20000” disableUploadTimeout=“true” />  

方式二new String(fileName.getBytes(“ISO-8859-1”),“utf-8”); //解决get方式中文乱码
注意:方式一与方式二不可以一起使用。

参考:https://my.oschina.net/abian/blog/122444

posted @ 2020-02-26 11:21  超级小白龙  阅读(489)  评论(0编辑  收藏  举报