asp从utf-8的页面跳到gb2312页面,数据库读取部分出现乱码

asp从utf-8的页面跳到gb2312页面,数据库读取部分出现乱码. 最近接了塑料破碎机的网站,收录跟同行其他的网站没法比,为了增加网站收录就搞了博客,编码是utf-8的,而网站的编码是gb2312的,由于程序上的疏忽,来回跳转,总是出现乱码。后来发现漏洞: ASP UTF-8页面乱码+GB2312转UTF-8 +生成UTF-8格式的文件(编码)最好的方法: 先说一下基本的东西: <%@ codepage=65001%>UTF-8 <%@ codepage=936%>简体中文 <%@ codepage=950%>繁体中文 <%@ codepage=437 %>美国/加拿大英语 <%@ codepage=932 %>日文 <%@ codepage=949 %>韩文 <%@ codepage=866 %>俄文 codepage指定了IIS按什么编码读取传递过来的串串(表单提交,地址栏传递等)。 出乱码的原因也就是网站要整合的时候模块编码不相同引起的。 就像我的博客相同,整合的时候都会出这个问题,因为BLOG是Utf-8的, 近来很多网友都在为这个问题咨询,我尝试了很多种方法。 最方便的方法如下: 不要转换任何模块网页的编码该utf-8的还是utf-8,该Gb22312的还是Gb2312 在Utf-8模块的包文档(如conn.asp,但是要注意conn.asp必须是在第一行调用)最前面加上 <%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%> <%Session.CodePage=65001%> 在GB2312模块的包文档最前面加上 <%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%> <%Session.CodePage=936%> 其他编码的类推。 UTF-8编码是一种支持多语言的国际化编码格式,它能够让不同语言操作系统和浏览器的用户访问中文网站时不用下载语言包即可正常浏览。而GB2312却做不到这一点,国内目前很多程序已经开始支持UTF-8编码。以下是博客作者对ASP中使用UTF-8编码的技巧小节。 以前做网页都是用的GB2312,因为刚开始不太了解,也就没注意这些。Dreamweaver中文版默认的就是简体中文,不写编码类型的话也是如此。然而,现在越来越多的网站采用unicode编码,这样做的好处自然不必多说。但是,要想真正用好utf-8并不是那么容易。下面我就总结一下自己遇到的问题。 首先,要把meta区的charset由gb2312改为utf-8,这点应该没有人不知道吧。在dreamweaver里可以直接设置[页面属性]中的[编码],然后会发现编辑器里的字体已经变了。但仅仅这样做是远远不够的,重要的还在下面。 然后要将所有文件保存成utf-8格式的。具体的方法是,用记事本打开要保存的文件,选[另存为],然后,在编码中将默认的ANSI(也就是ascii编码)改为utf-8,是utf-8而不是unicode或其他。 以上两点是其他很多网站都讲过的地方,仅仅这样做之后会发现,还有很多问题,比如汉字乱码,或者出现“未结束的字符串”等。下面还有三步! 1)ASP文件最前面写<%@CODEPAGE="65001"%>,原来就有的要改变CODEPAGE,utf-8就要用65001,前面那个脚本语言,如果就用vbscript的话就不用写了。不是每个文件都要写,而是只要在独立的页面写上就可以了,不包括包含文件。 2)经过上面的那些步骤,刷新一下,基本上就应该可以了。但是,你关闭浏览器重新打开试试,发现了什么?页面一片空白!打开右键菜单,找到编码,选择utf-8,这才一切正常。也就是说,浏览器可能不会自动识别编码。在第1)步内容的后面加上response.charset="utf-8"即可。 3)完成之后,重新打开浏览器,发现一切正常。但这并不代表工作已经完成了。多刷新几次试试?结果发现,第一次很正常,刷新之后,汉字就出现乱码了。这时,还要在第2)步的后面加上session.CodePage = 65001才行。这一句并不是每个文件都要加,只要在首页加上就行了。既然用session,就可能出现过期的现象,那就都加上吧。这时,如果你的站点中还有gb2312的页面,刷新它,就会发现,那个页面中的汉字已经出现乱码了。 经过以上若干步骤,不出意外,就可以正常使用utf-8了。 注意 有时会遇到奇数汉字或中英文混合时出现乱码或“未结束的字符串”,如果你用的是netbox而不是IIS的话,就请换用IIS,不用netbox,或把网页传到虚拟空间上再试。基本上都是netbox本身引起的。 数据库不需改动,因为数据库内部就是unicode编码的,出来的时候再转换成其他编码。另外,需要注意的是,在utf-8中不可以通过URL参数传递汉字,如果需要的话,要加上server.URLEncode(),记得以前使用gb2312时没遇到过这样的问题。 ASP中汉字与UTF-8的互相转换 '=============汉字转换为UTF-8================== function chinese2unicode(Str) for i=1 to len(Str) Str_one=Mid(Str,i,1) Str_unicode=Str_unicode&chr(38) Str_unicode=Str_unicode&chr(35) Str_unicode=Str_unicode&chr(120) Str_unicode=Str_unicode& Hex(ascw(Str_one)) Str_unicode=Str_unicode&chr(59) next chinese2unicode = Str_unicode end function '=============UTF-8转换为汉字================== function UTF2GB(UTFStr) for Dig=1 to len(UTFStr) if mid(UTFStr,Dig,1)="%" then if len(UTFStr) >= Dig+8 then GBStr=GBStr & ConvChinese(mid(UTFStr,Dig,9)) Dig=Dig+8 else GBStr=GBStr & mid(UTFStr,Dig,1) end if else GBStr=GBStr & mid(UTFStr,Dig,1) end if next UTF2GB=GBStr end function function ConvChinese(x) A=split(mid(x,2),"%") i=0 j=0 for i=0 to ubound(A) A(i)=c16to2(A(i)) next for i=0 to ubound(A)-1 DigS=instr(A(i),"0") Unicode="" for j=1 to DigS-1 if j=1 then A(i)=right(A(i),len(A(i))-DigS) Unicode=Unicode & A(i) else i=i+1 A(i)=right(A(i),len(A(i))-2) Unicode=Unicode & A(i) end if next if len(c2to16(Unicode))=4 then ConvChinese=ConvChinese & chrw(int("&H" & c2to16(Unicode))) else ConvChinese=ConvChinese & chr(int("&H" & c2to16(Unicode))) end if next end function function c2to16(x) i=1 for i=1 to len(x) step 4 c2to16=c2to16 & hex(c2to10(mid(x,i,4))) next end function function c2to10(x) c2to10=0 if x="0" then exit function i=0 for i= 0 to len(x) -1 if mid(x,len(x)-i,1)="1" then c2to10=c2to10+2^(i) next end function function c16to2(x) i=0 for i=1 to len(trim(x)) tempstr= c10to2(cint(int("&h" & mid(x,i,1)))) do while len(tempstr)<4 tempstr="0" & tempstr loop c16to2=c16to2 & tempstr next end function function c10to2(x) mysign=sgn(x) x=abs(x) DigS=1 do if x<2^DigS then exit do else DigS=DigS+1 end if loop tempnum=x i=0 for i=DigS to 1 step-1 if tempnum>=2^(i-1) then tempnum=tempnum-2^(i-1) c10to2=c10to2 & "1" else c10to2=c10to2 & "0" end if next if mysign=-1 then c10to2="-" & c10to2 end function GB2312转UTF-8 '个人代码风格注释(变量名中第一个小写字母表表示变量类型) 'i:为Integer型; 's:为String; Function U2UTF8(Byval a_iNum) Dim sResult,sUTF8 Dim iTemp,iHexNum,i iHexNum = Trim(a_iNum) If iHexNum = "" Then Exit Function End If sResult = "" If (iHexNum < 128) Then sResult = sResult & iHexNum ElseIf (iHexNum < 2048) Then sResult = ChrB(&H80 + (iHexNum And &H3F)) iHexNum = iHexNum &H40 sResult = ChrB(&HC0 + (iHexNum And &H1F)) & sResult ElseIf (iHexNum < 65536) Then sResult = ChrB(&H80 + (iHexNum And &H3F)) iHexNum = iHexNum &H40 sResult = ChrB(&H80 + (iHexNum And &H3F)) & sResult iHexNum = iHexNum &H40 sResult = ChrB(&HE0 + (iHexNum And &HF)) & sResult End If U2UTF8 = sResult End Function Function GB2UTF(Byval a_sStr) Dim sGB,sResult,sTemp Dim iLen,iUnicode,iTemp,i sGB = Trim(a_sStr) iLen = Len(sGB) For i = 1 To iLen sTemp = Mid(sGB,i,1) iTemp = Asc(sTemp) If (iTemp>127 OR iTemp<0) Then iUnicode = AscW(sTemp) If iUnicode<0 Then iUnicode = iUnicode + 65536 End If Else iUnicode = iTemp End If sResult = sResult & U2UTF8(iUnicode) Next GB2UTF = sResult End Function '调用方法 Response.BinaryWrite(GB2UTF("中国人")) ASP UTF-8 乱码问题的解决方法小结 这里整理下asp页面下出现乱码的问题,好多ajax读取的数据出现乱码的解决方法,asp.net,php等语言的乱码,解决原理都是一样的。 这个是网页编码的问题。中文一般采用的是gb2312这样的话显示中文基本上不会出现乱码。但是有时候我们用的是一种国际上通用的utf-8格式。如果utf-8格式人不是很了解的话是容易出现乱码的。 有许多朋友问过我,为什么在ASP里指定了codepage为65001还经常显示乱码.才子在这里将这个问题详细解释一下,以免很多朋友再走弯路,甚至排斥UTF-8. asp网页utf8乱码如果你还不知道UTF-8是什么东东,那才子建议你先去搜索一下UTF-8的相关资料吧. UTF-8编码之所以被越来越多的人接受甚至喜欢,肯定是有道理的,在WEB2.0盛行的今天,在大谈多浏览器兼容的同时,不得不想到字符编码不同所造成的乱码现象同样需要得到很好的处理..... 在N年以前,IE6以下的所有版本,只要没有安装相应的字库,访问相关的页面都是会乱码的,例如,我是IE5 (Windows2000默认) 的版本,在没有安装IE繁体字库的情况下,访问任何繁体页面的网站都是会乱码的,当然前提是该页面采用了BIG5的Charset,而UTF-8作为一种 国际编码就能很好的处理该问题,只要将页面存为UTF-8编码格式,再在页面上将codepage及charset全部定义为utf-8就可以在任何客户 端浏览器中显示出完全正确的内容,完全不会乱码...... 好了,才子这里以ASP页面为例,以一个实例来看具体操作吧: 在这才子推荐用Editplus来写代码,才子也专门写过一篇Editplus的使用教程,有兴趣的朋友可以点击这里 去看看. 打开新建一个ASP页面,相信玩ASP的朋友都会留意到,许多下载的源码里,页面最上方一般都有一句: <%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%> 前面的language应该不用多说了,vbscript就是ASP默认的脚本语言,其实完全可以不用写,写了好像还会影响页面执行效率,在这里我们先不 讨论这个问题. 后面的codepage就是关键了,目的就是告诉浏览器,此页面是何种编码,936代表是简体中文,而950代表繁体中文,65001就是我们今天说的 UTF-8编码了.我们将936改成65001,整句如下: <%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%> 再加上输出几个中文字看看能不能正确显示吧. <% Response.Write "第一次测试UTF-8页面" %> OK,直接点击"保存",执行这个页面看看,如果不出意外,大家可能看到显示出的是 "一尾UTF-8页" 这几个字,中文有乱码的现象,什么原因呢? OK,请大家再点击最上面的 "文件" 菜单,选择"另存为",最下面一行有个编码,默认应该是ANSI的,请大家点下拉框,选择UTF-8,再点保存,再执行试试看,如果不出意外,乱得更厉害 了,呵呵,晕了吧.别急,想想原因,因为我们做的页面是HTML返回的,以前我们写HTML时,看到body前面,也就是head里都有一句meta,应 该是这样的: <meta http-equiv="Content-Type" content="text/html; charset=gb2312"> 也就是指定页面以gb2312编码返回结果,一定要写在有返回结果输出的前面.大家都知道gb2312是简体中文吧,我们今天说的是UTF-8编码,我们就将gb2312改成UTF-8吧,全部代码如下: <%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%> <meta http-equiv="Content-Type" content="text/html; charset=utf-8"> <% Response.Write "第一次测试UTF-8页面" %> 再执行看看,嗯,这次正常显示了吧....... asp网页utf8乱码结论:采用UTF-8编码,除了要将文件另存为UTF-8格式之外,还需要同时指定codepage及charset. 保证asp叶面一定不会出现乱码的代码应该是这样的: (假定是UTF-8的叶子) <%@ CODEPAGE=65001 %> <% Response.CodePage=65001%> <% Response.Charset="UTF-8" %> 可以建立公共文件code.asp,所有页面都包含这个编码指定. Asp生成UTF-8格式的文件(编码) ASP中操作UTF-8格式的文件 注意:这里说的ASP可不是ASP.net。 ASP由于是一种古老的语言,它的一些功能对UTF-8支持非常差。 比如,你想生成一个UTF-8格式的文件,使用常用的 Scripting.FileSystemObject 对象就不行。 Scripting.FileSystemObject 对象创建文件的函数,是下面方式: FileSystemObject.CreateTextFile(filename[,overwrite[,unicode]]) 其中的 unicode 属性是这样描述的: 可选项。Boolean 值指明是否以 Unicode 或 ASCII 文件格式创建文件。如果以 Unicode 文件格式创建文件,则该值为 True;如果以 ASCII 文件格式创建文件,则该值为 False。如果省略此部分,则假定创建 ASCII 文件。 我们是无法用这个函数来创建UTF-8格式文件的。 这时候,我们可以使用 ADODB.Stream 对象,使用方法见下面: 以下是引用片段: Set objStream = Server.CreateObject("ADODB.Stream") With objStream .Open .Charset = "utf-8" .Position = objStream.Size .WriteText=str .SaveToFile server.mappath("/sitemap.xml"),2 .Close End With Set objStream = Nothing 附: ASCII 、Unicode 、 UTF-8 介绍: ASCII 是一种字符集,包括大小写的英文字母、数字、控制字符等,它用一个字节表示,范围是 0-127。 由于 ASCII 表示的字符非常有限,各个国家或者地区在此基础上提出了自己的字符集,比如在中国应用非常广泛的 GB2312,它为汉字提供了编码,用两个字节表示。 这些字符集之间互不兼容,相同的数字可能表示不同的字符,为信息交流带来了麻烦。 Unicode 是一种字符集,它将世界上的所有字符映射成一个唯一的数字(code point),比如字母 a 对应的数字 0x0041。目前 Unicode 还处于发展中,它所包容的字符越来越多。 在将 Unicode 表示的字符进行存储时,还需要一定的编码方式,比如 UCS-2,它用两个字节来表示 Unicode 编码的字符。而 UTF-8 是 Unicode 字符集的另外一种编码方式,它是变长度的,最多 6 个字节,小于 127 的字符用一个字节表示,与 ASCII 字符集的结果一样,因而具有非常好的兼容性,ASCII 编码下的英语文本不需要修改就可以当作 UTF-8 编码进行处理,应用非常广泛。 完整示例: '================================================ '函数名:CreatedTextFiles '作 用:创建文本文件 '参 数:filename ----文件名 ' body ----主要内容 '================================================ Public Function CreatedTextFiles(ByVal FileName, ByVal body) On Error Resume Next If InStr(FileName, ":") = 0 Then FileName = Server.MapPath(FileName) Dim oStream Set oStream = CreateObject("ADODB.Stream") oStream.Type = 2 '设置为可读可写 oStream.Mode = 3 '设置内容为文本 oStream.Charset = "UTF-8" oStream.Open oStream.Position = oStream.Size oStream.WriteText body oStream.SaveToFile FileName, 2 oStream.Close Set oStream = Nothing If Err.Number <> 0 Then Err.Clear End Function 调用示例: Dim strContent Dim filePath FilePath="../text.txt" strContent = "脚本之家" CreatedTextFiles filePath, strContent'生成UTF-8编码的文件 http://www.xieguang133.com/

posted on 2010-06-25 15:32  xieguang133  阅读(301)  评论(0)    收藏  举报

导航