打对了

宇宙和生命从哪里来?又要到哪里去呢?

 

字符集编码ANSI和UNICODE

 本文为原创,参考了一些网上的资料.

编码指不同国家的语言在计算机中的一种存储和解释规范
ANSI与ASCII

n最初,Internet上只有一种字符集——ANSI的ASCII字符集(American Standard Code for Information Interchange, “美国信息交换标准码),它使用7 bits来表示一个字符,总共表示128个字符,后来IBM公司在此基础上进行了扩展,用8bit来表示一个字符,总共可以表示256个字符,充分利用了一个字节所能表达的最大信息
nANSI字符集:ASCII字符集,以及由此派生并兼容的字符集,如:GB2312,正式的名称为MBCS(Multi-Byte Chactacter System,多字节字符系统),通常也称为ANSI字符集。

UNICODE与UTF8,UTF16

n由于每种语言都制定了自己的字符集,导致最后存在的各种字符集实在太多,在国际交流中要经常转换字符集非常不便。因此,产生了Unicode字符集,它固定使用16 bits(两个字节)来表示一个字符,共可以表示65536个字符
n标准的Unicode称为UTF-16(UTF:UCS Transformation Format )。后来为了双字节的Unicode能够在现存的处理单字节的系统上正确传输,出现了UTF-8,使用类似MBCS的方式对Unicode进行编码。(Unicode字符集有多种编码形式)
 例如“连通”两个字的Unicode标准编码UTF-16 (big endian)为:DE 8F 1A 90
                 而其UTF-8编码为:E8 BF 9E E9 80 9A


n当一个软件打开一个文本时,它要做的第一件事是决定这个文本究竟是使用哪种字符集的哪种编码保存的。软件一般采用三种方式来决定文本的字符集和编码:
检测文件头标识,提示用户选择,根据一定的规则猜测
最标准的途径是检测文本最开头的几个字节,开头字节 Charset/encoding,如下表:
EF BB BF    UTF-8
FE FF     UTF-16/UCS-2, little endian
FF FE     UTF-16/UCS-2, big endian
FF FE 00 00   UTF-32/UCS-4, little endian.
00 00 FE FF   UTF-32/UCS-4, big-endian.

posted on 2004-11-17 13:42 知道得越多知道的越少 阅读(6015) 评论(7)  编辑 收藏 网摘 所属分类: Dot.Net,Vb,网页技术

评论

#1楼  2004-11-17 13:58 Ninputer [未注册用户]

GB18030呢?GB2313已经淘汰了   回复  引用    

#2楼 [楼主] 2004-11-17 14:23 知道得越多知道的越少      

还是Unicode是通用标准.
一般gb2312就够用了,特殊领域可以考虑GB18030
http://www.microsoft.com/china/windows2000/downloads/18030.asp
http://tech.sina.com.cn/s/2001-07-26/1850.html   回复  引用  查看    

#3楼  2004-11-17 23:44 unruledboy(灵感之源)      

gb2312淘汰?   回复  引用  查看    

#4楼  2005-05-07 10:40 过客 [未注册用户]

我检测了一下好像是这样的
EF BB BF    UTF-8
FE FF     UTF-16/UCS-2, big endian
FF FE     UTF-16/UCS-2, little endian

  回复  引用    

#5楼  2005-12-23 14:30 王者之风 [未注册用户]

搞错了,应该是
EF BB BF    UTF-8
FE FF     UTF-16/UCS-2, big endian
FF FE     UTF-16/UCS-2, little endian   回复  引用    

#6楼  2007-04-24 14:25 ? [未注册用户]

“连通”两个字的Unicode标准编码UTF-16 (big endian)为:DE 8F 1A 90


错了!
\

应该: 8FDE 901A   回复  引用    

#7楼  2007-04-24 14:29 ? [未注册用户]

我错了,不好意思,我用的是 little endian   回复  引用    





标题  
姓名  
主页
Email (博主才能看到) 
验证码 *  看不清,换一张 [登录][注册]
内容(请不要发表任何与政治相关的内容)  
  登录  使用高级评论  新用户注册  返回页首  恢复上次提交      
该文被作者在 2006-04-04 12:25 编辑过
Google站内搜索

相关文章:

相关链接:
 

导航

统计

公告

对你说打错了 我不是你那个什么
你想找的那个 就算我跟她同名同姓又如何
都说你打错了 我要欺骗你干什么
你们多久没见连 我跟她的声音你都不认得
你怎么样过 什么样的生活 是否难耐寂寞
你到底是谁 总是阴差阳错 擦过我的耳朵
第几次打错了 这是注定还是巧合
谁是玛格列特 她知道你的着急一定很快乐
你们发生什么 还是你欠了她什么
有什么舍不得 她不住这里你却非找她不可
你怎么样过 什么样的生活 是否难耐寂寞
你到底是谁 总是阴差阳错 擦过我的耳朵
你怎么样过 什么样的生活 是否难耐寂寞
你到底是谁 总是阴差阳错 擦过我的耳朵
你们会讲什么口气会不会软软的
你紧张得想哭 多年后想起今天值得不值得

与我联系

搜索

 

常用链接

留言簿(4)

我参与的团队

我的标签

随笔分类

随笔档案

文章分类

文章档案

收藏夹

音乐

有价值的blog

最新评论

阅读排行榜

评论排行榜