李sir_Blog

博客园 首页 联系 订阅 管理

检查自已的代码时,发现一个比较弱智的错误,是关于转码的,和CString的=操作符有关。
  为了能简单重现,我模拟了一下代码:

  //未有UNICODE或_UNICODE定义
  USES_CONVERSION;
  CString sTest(_T("test中文"));
  sTest = A2W(sTest);
  ::MessageBoxW(NULL,(LPCWSTR)sTest.GetBuffer(0),L"test中文标题",MB_OK);

  输出:
      对话框的内容区为乱码。

  我的想象中:A2W取得宽字符串,然后赋值给CString,CString中应该保存的是宽字符串。
  显然,并不如我想,想是没用的,仔细看一下出错的原因吧。

  先看看CString=操作符源码:
  #ifdef _UNICODE
  ……
  #else //!_UNICODE
  const CString& CString::operator=(LPCWSTR lpsz)
  {
     int nSrcLen = lpsz != NULL ? wcslen(lpsz) : 0;
     AllocBeforeWrite(nSrcLen*2);
     _wcstombsz(m_pchData, lpsz, (nSrcLen*2)+1);
     ReleaseBuffer();
     return *this;
  }
  哇,_wcstombsz在干什么?
  再看看它的代码:
  int AFX_CDECL _wcstombsz(char* mbstr, const wchar_t* wcstr, size_t count)
  {
     if (count == 0 && mbstr != NULL)
        return 0;
     int result = ::WideCharToMultiByte(CP_ACP, 0, wcstr, -1,
         mbstr, count, NULL, NULL);
     ASSERT(mbstr == NULL || result <= (int)count);
     if (result > 0)
         mbstr[result-1] = 0;
     return result;
  }
  嘿,居然是在转码噢。
  好了,答案找到了,CString的 = 操作符居然会智能的做转码,所以上面代码的sTest最终得到的仍然是ANSI字符串。因此,输出是乱码。

  结论:CString = 操作符是有转码功能的,会将右侧的字符转为TCHAR的当前编码方式。
  换句话说,如果你想实现A2T或是W2T,那你根本不需要用ATL的宏,直接用CString的=就可以了,呵呵。

  好了,改一下前文的代码,不能想当然,老老实实的做吧。
  USES_CONVERSION;
  CString sTest(_T("test中文"));
  LPWSTR lpwszTest = A2W(sTest);
  ::MessageBoxW(NULL,lpwszTest.GetBuffer(0),L"test中文标题",MB_OK);

posted on 2011-01-30 13:11  李sir  阅读(1659)  评论(0编辑  收藏  举报