文章分类 -  字符集!

摘要:我总是遇上这样那样的怪事。(我也是)昨天我在公司用EditPlus做了一个utf8编码的php文件。带到住处后用dreamweaver打开却发现它有点GB2312的样子,查看了页面属性居然真的是GB2312的。这是在令人郁闷。没有办法。我只好再次将它转换成utf8的。保存之后关闭,再次打开。见鬼了,依然是GB2312的。莫非是dreamw手脚不干净?于是我用EditPlus打开,另存为utf8.另存时候我发现默认是ANSI格式的,用EditPlus再次打开的时候,我愤怒了,依然是一副GB2312的样子,另存时候还是显示ANSI编码。怎么回事?明明已经另存UTF8了啊,为什么再次打开依然GB23 阅读全文
posted @ 2014-01-03 16:31 Tup 阅读(662) 评论(0) 推荐(0)
摘要:从GB2312-1980编码开始,汉字都是采用双字节编码。为了与系统中基本的ASCII字符集区分开,所有汉字编码的每个字节的第一位都是1。例如: “啊”字的编码为0xB0A1。GB2312的汉字编码规则为:第一个字节的值在0xB0到0xF7之间,第二个字节的值在0xA0到0xFE之间。 GB12345和GB13000是对GB2312-1980的扩充,所有已经包含在GB2312中的汉字编码不变,另外增加更多的码位。其编码规则大致 为:第一个字节的值在0x81到0xFE之间,第二个字节的值在0x40到0xFE之间。由于GB13000是对GB2312的扩展,所以也被成为 GBK。 GB18030也是 阅读全文
posted @ 2014-01-03 15:53 Tup 阅读(1290) 评论(0) 推荐(0)
摘要:GB2312简体中文编码表code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +FA1A0 、 。 · ˉ ˇ ¨ 〃 々 — ~ ‖ … ‘ ’A1B0 “ ” 〔 〕 〈 〉 《 》 「 」 『 』 〖 〗 【 】A1C0 ± × ÷ ∶ ∧ ∨ ∑ ∏ ∪ ∩ ∈ ∷ √ ⊥ ∥ ∠A1D0 ⌒ ⊙ ∫ ∮ ≡ ≌ ≈ ∽ ∝ ≠ ≮ ≯ ≤ ≥ ∞ ∵A1E0 ∴ ♂ ♀ ° ′ ″ ℃ $ ¤ ¢ £ ‰ § № ☆ ★A1F0 ○ ● ◎ ◇ ◆ □ ■ 阅读全文
posted @ 2014-01-03 15:49 Tup 阅读(653) 评论(0) 推荐(0)