有关WCHAR（转）

转自：http://www.cppblog.com/shongbee2/archive/2009/04/28/81349.html

WCHAR我不再惧怕了

宽字符已经困扰我很久了，以前我都是设置项目的属性把它改为多字节，不用UNICODE。不过现在又遇到宽字节的问题，没有办法，只有硬着头皮学学：
我找到的资料：
http://hi.baidu.com/shongbee2/blog/item/207925546b6cdd5fd10906e0.html
http://hi.baidu.com/shongbee2/blog/item/d4a057511e9539878c5430cb.html
看了之后我才发现原来有wcsXXX的函数专门处理宽字节的，就是strXXX一样好使。呵呵，我不再惧怕了，就试着自己写了一下，还是学了蛮多东西的：
1.有wcsXXX的函数和strXXX的函数对应处理宽字节，wcslen就是求长度的，wcscmp就是比较两个字符串的。
2. 输出也有相关的操作，wprintf(L”%s%s”);这样的操作，对文件也可以用fwprintf函数来输出。不过我发现貌似cout << wchar；不成功。也发现了一个问题，就是我输出”相等”这样一个字符串的时候，发现居然输出不正确，无论是控制台和文件都有错误。可见，这个还是有点小问题的。输出其他的例如”12345”等都是正常的。哎，这个函数并不可靠啊。
3.宽字节和普通串的转换问题，学了两个函数，一个是：
wcstombs(char* strDes, const wchar*, size_t nMax);这个函数的作用是把wchar转换为char。
char* strDes 为保存转换后的普通字符串，wchar* 要被转换的宽字符串。转换的最大长度。这里的长度是转换的个数，而不是字节长度。
mbstowcs() 就是一个相反的过程了，参数就不说了。

另一套转换的函数是：
int WideCharToMultiByte(
UINT CodePage,
DWORD dwFlags,
LPCWSTR lpWideCharStr,
int cchWideChar,
LPSTR lpMultiByteStr,
int cbMultiByte,
LPCSTR lpDefaultChar,
LPBOOL lpUsedDefaultChar
);
他的参数很多，上面的连接有介绍，这里就不怎么细说了。
第一个是编码的方式，我一般用CP_ACP。第二个是转换标志，MSDN上说什么都不设置更快，然后我就什么都不管了就用NULL了。具体作用不知道，等遇到了再学。第三个参数就是被转换的字符串，第四个参数是该字符串的长度，-1表示自动算长度，如果是手动给出，一定要把最后的终结符长度也算上。我觉得还是-1来的实际。第五个参数就是保存转换串的指针，第六个参数就是保存串的长度，这里是单位字符的个数。如果转换的时候没有终结符，那么结果也没有终结符，要注意下。最后两个参数就是默认的填充字符和是否使用了默认填充字符，我一般就用NULL代替。

普通串转宽字节也是类似。
这里有几个注意的，一定要保证空间足够。还有就是那个长度是单位字符个数，而不是字节数，在转换时，推荐被转换的字符串长度设置为-1,因为这样他会自动算出终结符结束。返回值也是转换的单位字符个数。例如”相等”有普通串转换为宽字节串，返回结果是3，（有终结符），而反过来就是5。如果返回时0 说明转换失败。

心得：虽然WideCharToMultiByte的参数要多，感觉用的没有wcstombs爽，可是他的准确好高一些，要转换的话，还用用WideCharToMultiByte比较合适，还有就是虽然有一套wcsXXX的库函数，可惜输出还是出现问题的。如果全都用宽字节，那没有关系wcsxxx的函数还是蛮好用的。还有一个疑惑我明明查字典multi是多的意思也就是说multibyte是多字节，我的中文版 VS2005配置里面也是说的多字节。搞不懂为什么要用宽字节呢？可能是多字节编码不好用吧。呵呵。废话也说完了，奉上源代码：

#include <iostream>
#include <fstream>
#include <windows.h>
using namespace std;

int main()
{
    FILE* fp ;
    WCHAR wchar[5] = L"相等相等";        //定义一个宽字节的变量，初始为"相等"
    fp = fopen("1.txt", "w+");        //打开文件称奥做
    fwprintf(fp, L"%s\n", wchar);    //输出到文件
    fclose(fp);                        //关闭文件
    WCHAR wc2[5];                    //定义第二个宽字节变量

    //wc开始的有很多宽字节的操作。都和str相对应。
    wcscpy(wc2, wchar);                //复制。
    int n = wcscmp(wc2, wchar);        //比较
    if (n == 0)
    {
        wprintf(L"相等\n");            //这里是否注意到没有wprintf有问题的。
    }

    char str[10];                    //定义char字符。
    n = wcstombs(str, wc2, 9);        //宽字节转换为muiltychar
    printf("%s\n", str);            //输出结果

    for (int i = 0; i < 5; ++i)
    {
        wc2[i] = L'1' + i;
    }
    wc2[4] = 0;

    n = wcstombs(str, wc2, 9);        //宽字节转换为muiltychar
    printf("%s\n", str);            //输出结果
    //另外的方式转换
    n = WideCharToMultiByte(CP_ACP, NULL, wchar, wcslen(wchar) + 1, str, 10, 0, 0);
    printf("%s\n", str);
    char str2[10] = "加一";
    WCHAR wc3[10];
    n = MultiByteToWideChar(CP_ACP, NULL, str2, strlen(str2) + 1, wc3, 10);    //char到宽字节。

    system("pause");
    return 0;
}

不要脸的再次放入精华区，因为我觉得他困扰我太久了。呵呵

posted on 2009-04-28 20:09 shongbee2 阅读(3095) 评论(14) 编辑收藏引用所属分类: COM相关

# re: WCHAR我不再惧怕了 2009-04-28 21:42 runsisi

wcout<<L"相等"; 回复更多评论

# re: WCHAR我不再惧怕了 2009-04-28 21:45 wcc

VC2005的标准库也支持宽字符的，名字前加w就行了，wcout << ... 回复更多评论

# re: WCHAR我不再惧怕了 2009-04-28 21:52 shongbee2

哦。。我真笨啊。。居然没有想到。。谢谢你们！
可惜刚刚试了一下，虽然可以输出了，但是输出"相等"字符串的时候还是出现了问题。呵呵，谢谢你们！回复更多评论

# re: WCHAR我不再惧怕了 2009-04-28 22:34 小游戏

我很惧怕代码！　汗！！回复更多评论

# re: WCHAR我不再惧怕了 2009-04-28 22:40 OwnWaterloo

@shongbee2

#include <locale>

wcout<<L"汉字";
assert( !wcout );

wcout.imbue(locale("chs"));
wcout.clear();
wcout<<L"汉字";

回复更多评论

# re: WCHAR我不再惧怕了 2009-04-29 07:43 poco

whar在跨平台时太多问题回复更多评论

# re: WCHAR我不再惧怕了 2009-04-29 07:51 poco

whchar_t在windows下是两个字节，在Linux下是4字节，要想wchar_t在linux下也是两字节，gcc 加-fshort-wchar编译选项。回复更多评论

# re: WCHAR我不再惧怕了 2009-04-29 08:33 guest

如果是针对windows，那么就用TCHAR，兼容MBCS和UNICODE两种了。
strcpy,wcscpy对应_tcscpy。。等等回复更多评论

# re: WCHAR我不再惧怕了 2009-04-29 09:04 岳阳

嗯，用_tcsXXX挺好。回复更多评论

# re: WCHAR我不再惧怕了 2009-04-29 12:59 shongbee2

@OwnWaterloo
谢谢您，可以了。谢谢。原来要设置一下语言环境啊。回复更多评论

# re: WCHAR我不再惧怕了 2009-04-29 13:00 shongbee2

@guest
谢谢。。我试试。呵呵。
没有想到宽字节这么难用。呵呵。
回复更多评论

# re: WCHAR我不再惧怕了 2009-04-29 15:31 tangxinfa

我现在是统一用char了，需要宽字符时再转换，呵呵。回复更多评论

# re: WCHAR我不再惧怕了 2009-04-30 20:30 shongbee2

@tangxinfa
哈哈，我也一样。
不过貌似宽字节是个趋势。。回复更多评论

# re: WCHAR我不再惧怕了 2009-05-03 18:05 zhupf

语言环境要设置的.哈哈.
这个我也是尝试过之后才知道 .
不然输出显示是乱码. 回复更多评论

posted @ 2010-03-12 13:36 Bob Yang 阅读(1325) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

Bob Yang

勤能补拙