文章分类 - 字符集!

【转】你到底是UTF-8还是ANSI（Editplus）?

摘要：我总是遇上这样那样的怪事。（我也是）昨天我在公司用EditPlus做了一个utf8编码的php文件。带到住处后用dreamweaver打开却发现它有点GB2312的样子，查看了页面属性居然真的是GB2312的。这是在令人郁闷。没有办法。我只好再次将它转换成utf8的。保存之后关闭，再次打开。见鬼了，依然是GB2312的。莫非是dreamw手脚不干净？于是我用EditPlus打开，另存为utf8.另存时候我发现默认是ANSI格式的，用EditPlus再次打开的时候，我愤怒了，依然是一副GB2312的样子，另存时候还是显示ANSI编码。怎么回事？明明已经另存UTF8了啊，为什么再次打开依然GB23 阅读全文

posted @ 2014-01-03 16:31 Tup 阅读(662) 评论(0) 推荐(0)

GB2312与GB18030有什么区别？

摘要：从GB2312-1980编码开始，汉字都是采用双字节编码。为了与系统中基本的ASCII字符集区分开，所有汉字编码的每个字节的第一位都是1。例如： “啊”字的编码为0xB0A1。GB2312的汉字编码规则为：第一个字节的值在0xB0到0xF7之间，第二个字节的值在0xA0到0xFE之间。 GB12345和GB13000是对GB2312-1980的扩充，所有已经包含在GB2312中的汉字编码不变，另外增加更多的码位。其编码规则大致为：第一个字节的值在0x81到0xFE之间，第二个字节的值在0x40到0xFE之间。由于GB13000是对GB2312的扩展，所以也被成为 GBK。 GB18030也是阅读全文

posted @ 2014-01-03 15:53 Tup 阅读(1290) 评论(0) 推荐(0)

GB2312简体中文编码表

摘要：GB2312简体中文编码表code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +FA1A0 、。 · ˉ ˇ ¨ 〃々 — ～ ‖ … ‘ ’A1B0 “ ” 〔〕〈〉《》「」『』〖〗【】A1C0 ± × ÷ ∶ ∧ ∨ ∑ ∏ ∪ ∩ ∈ ∷ √ ⊥ ∥ ∠A1D0 ⌒ ⊙ ∫ ∮ ≡ ≌ ≈ ∽ ∝ ≠ ≮ ≯ ≤ ≥ ∞ ∵A1E0 ∴ ♂ ♀ ° ′ ″ ℃ ＄ ¤ ￠￡ ‰ § № ☆ ★A1F0 ○ ● ◎ ◇ ◆ □ ■ 阅读全文

posted @ 2014-01-03 15:49 Tup 阅读(653) 评论(0) 推荐(0)