随笔分类 -  编码转换

摘要:为使计算机支持更多语言,通常使用 0x80~0xFF 范围的 2 个字节来表示 1 个字符。比如:汉字 '中' 在中文操作系统中,使用 [0xD6,0xD0] 这两个字节存储。 不同的国家和地区制定了不同的标准,由此产生了 GB2312, BIG5, JIS 等各自的编码标准。这些使用 2 个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文系统下,ANSI 编码代表 GB2312 编码,在日文操作系统下,ANSI 编码代表 JIS 编码。 不同 ANSI 编码之间互不兼容,当信息在国际间交流时,无法将属于两种语言的文字,存储在同一段 ANSI 编码的文 阅读全文
posted @ 2009-07-31 10:48 dzqabc 阅读(256) 评论(0) 推荐(0)
摘要:CodePage简介(转) 1. Codepage的定义和历史字符内码(charctercode)指的是用来代表字符的内码.读者在输入和存储文档时都要使用内码,内码分为单字节内码 -- Single-Byte character sets (SBCS),可以支持256个字符编码. 双字节内码 -- Double-Byte character sets)(DBCS),可以支持65000个字符编码.主要用来对大字符集的东方文字进行编码. codepage指的是一个经过挑选的以特定顺序排列的字符内码列表,对于早期的单字节内码的语种,codepage中的内码顺序使得系统可以按照此列表来根据键盘的输入. 阅读全文
posted @ 2009-06-27 10:03 dzqabc 阅读(2137) 评论(0) 推荐(0)
摘要:想把一个文件中的日文部分提取出来,可是其他的东西都不知道是什么,好在还能查到SHIFT-JIS编码的范围。有个范围怎么着还是能将就是把文字提出来,只是没有格式罢了。转自:http://blog.csdn.net/walacewang/archive/2006/03/03/614382.aspxShift_JIS是一个日本电脑系统常用的编码表。它能容纳全形及半形拉丁字母、平假名、片假名、符号及日语汉字。它被命名为Shift_JIS的原因,是它在放置全形字符时,要避开原本在0xA1-0xDF放置的半角假名字符。在微软及IBM的日语电脑系统中,即使用了这个编码表。这个编码表称为CP932。字节结构以 阅读全文
posted @ 2009-06-27 09:57 dzqabc 阅读(7985) 评论(0) 推荐(0)
摘要:keyit.focus();}//========================================================================//TITLE:// MultiByteToWideChar和WideCharToMultiByte用法详解//AUTHOR:// norains//DATE:// 第一版:Monday 25-December -2006// 增补版:Wednesday 27-December -2006// 修订版:Wednesday 14-March-2007 (修正之前的错误例子)// 再次修订版:Tuesday 18-Sept 阅读全文
posted @ 2009-06-27 09:50 dzqabc 阅读(240) 评论(0) 推荐(0)
摘要:关于中日文和UNICODE之间编码的转换(2008-7-25 15:05:00)【收藏】 【评论】 【打印】 【关闭】 标签:JISSHIFT-JISgb2312Unicode转换 最近一段做一些关于文字编码方面的东西,常常涉及到各种编码字符之间的转换。主要是做中日文方面的,包括中文gb2312, 日文JIS, SHIFT-JIS,以及他们和Unnicode码之间的转换。一 GBK <==> Unicodeunsigned short GBK2UNI(unsigned short usGBK){ unsigned char szEUC[2] = { usGBK >> 8 阅读全文
posted @ 2009-06-27 09:49 dzqabc 阅读(1527) 评论(0) 推荐(0)