摘要:
用二进制方式创建一个文件,然后写UTF-8文件头(必须在后续写之前) char header[3] = {0xef, 0xbb, 0xbf}; // UTF-8 file header FILE * fp = fopen(pszFile, "w+b"); fwrite(line, sizeof(char), 3, fp); /*在UTF-8文件头部之后写入其他信息 */ fclose(fp);这样这个文件就成为UTF-8编码的文本文件了。之后其他信息都写在UTF-8文件头部之后就OK了! 阅读全文
posted @ 2011-04-11 01:20
清清飞扬
阅读(6484)
评论(0)
推荐(3)
摘要:
U+0123456789ABCDEF----------------------------------------------------- 4e00 一 丁 丂 七 丄 丅 丆 万 丈 三 上 下 丌 不 与 丏 4e10 丐 丑 丒 专 且 丕 世 丗 丘 丙 业 丛 东 丝 丞 丟 4e20 丠 両 丢 丣 两 严 並 丧 丨 丩 个 丫 丬 中 丮 丯 4e30 丰 丱 串 丳 临 丵 丶 丷 丸 丹 为 主 丼 丽 举 丿 4e40 乀 乁 乂 乃 乄 久 乆 乇 么 义 乊 之 乌 乍 乎 乏 4e50 乐 乑 乒 乓 乔 乕 乖 乗 乘 乙 乚 乛 乜 九 乞 也 4e60 习 阅读全文
posted @ 2011-04-11 01:06
清清飞扬
阅读(3431)
评论(0)
推荐(1)
摘要:
由于常常要和汉字处理打交道,因此,我常常受到汉字编码问题的困扰。在不断的打击与坚持中,也积累了一点汉字编码方面的经验,想和大家一起分享。一、汉字编码的种类 汉字编码中现在主要用到的有三类,包括GBK,GB2312和Big5。 1、GB2312又称国标码,由国家标准总局发布,1981年5月1日实施,通行于大陆。新加坡等地也使用此编码。它是一个简化字的编码规范,当然也包括其他的符号、字母、日文假名等,共7445个图形字符,其中汉字占6763个。我们平时说6768个汉字,实际上里边有5个编码为空白,所以总共有6763个汉字。 GB2312规定“对任意一个图形字符都采用两个字节表示,每个字节均采用七位 阅读全文
posted @ 2011-04-11 01:02
清清飞扬
阅读(1171)
评论(0)
推荐(2)
浙公网安备 33010602011771号