yzx99

导航

统计
 

用记事本分别用三种编码保存同一个内容
文件内容:中国ABC

保存编码:ANSI
文件长度:9=2+2+ 1+1+1+ 1+1
具体内容:
D6 D0 B9 FA 41 42 43 0D - 0A

保存编码:UniCode
文件长度:16=2+ 2+2+ 2+2+2+ 2+2
具体内容:FF FE 2D 4E FD 56 41 00 - 42 00 43 00 0D 00 0A 00

保存编码:UTF-8
文件长度:14=3+ 3+3+ 1+1+1+ 1+1
具体内容:EF BB BF E4 B8 AD E5 9B - BD 41 42 43 0D 0A

结论:
ANSI保存中文就是GB2312的编码,英文一个字节
UniCode前面有两个引导符,然后中文、英文都是两个字节,英文就是ANSI前面加00而成(保存时,低位在前,高位在后)
UTF-8前面有三个引导符,然后中文三个字节,英文一个字节

posted on 2008-08-29 11:00 yzx99 阅读(...) 评论(...) 编辑 收藏