代码改变世界

[转]CString, BSTR, LPCTSTR

2012-10-25 20:15  Ball Cactus  阅读(495)  评论(0编辑  收藏  举报

CString是一个动态TCHAR数组,
BSTR是一种专有格式的字符串(需要用系统提供的函数来操纵)
LPCTSTR只是一个常量的TCHAR指针。
CString 是一个完全独立的类,动态的TCHAR数组,封装了+等操作符和字符串操作方法。
typedef OLECHAR FAR* BSTR;
typedef const char * LPCTSTR;

VC++中各种字符串的表示法
首先char* 是指向ANSI字符数组的指针,其中每个字符占据8位(有效数据是除掉最高位的其他7位),这里保持了与传统的C,C++的兼容。
LP的含义是长指针(long pointer)。LPSTR是一个指向以‘\0’结尾的ANSI字符数组的指针,与char*可以互换使用,在win32中较多地使用LPSTR。
而LPCSTR中增加的‘C’的含义是“CONSTANT”(常量),表明这种数据类型的实例不能被使用它的API函数改变,除此之外,它与LPSTR是等同的。

1.LP表示长指针,在win16下有长指针(LP)和短指针(P)的区别,而在win32下是没有区别的,都是32位.所以这里的LP和P是等价的.
2.C表示const
3.T是TCHAR,在采用Unicode方式编译时是wchar_t,在普通时编译成char.

  为了满足程序代码国际化的需要,业界推出了Unicode标准,它提供了一种简单和一致的表达字符串的方法,所有字符中的字节都是16位的值,其数量也可以满足差不多世界上所有书面语言字符的编码需求,开发程序时使用Unicode(类型为wchar_t)是一种被鼓励的做法。
  LPWSTR与LPCWSTR由此产生,它们的含义类似于LPSTR与LPCSTR,只是字符数据是16位的wchar_t而不是char。
为了实现两种编码的通用,提出了TCHAR的定义:
如果定义_UNICODE,声明如下:
  typedef wchar_t TCHAR;
如果没有定义_UNICODE,则声明如下:
  typedef char TCHAR;

LPTSTR和LPCTSTR中的含义就是每个字符是这样的TCHAR。
如  LPCTSTR:
  #ifdef _UNICODE
    typedef const wchar_t * LPCTSTR;
  #else
    typedef const char * LPCTSTR;
  #endif
CString类中的字符就是被声明为TCHAR类型的,它提供了一个封装好的类供用户方便地使用。

VC常用数据类型使用转换详解
先定义一些常见类型变量借以说明
int i = 100;
long l = 2001;
float f=300.2;
double d=12345.119;
char username[]="女侠程佩君";
char temp[200];
char *buf;
CString str;
_variant_t v1;
_bstr_t v2;

一、其它数据类型转换为字符串

短整型(int)
   itoa(i,temp,10);  //将i转换为字符串放入temp中,最后一个数字表示十进制
   itoa(i,temp,2);   //按二进制方式转换
长整型(long)
   ltoa(l,temp,10);

二、从其它包含字符串的变量中获取指向该字符串的指针

CString str = "2008北京奥运";
char *buf = (LPSTR)(LPCTSTR)str;

BSTR类型的_variant_t变量
v1 = (_bstr_t)"程序员";
buf = _com_util::ConvertBSTRToString((_bstr_t)v1);

三、字符串转换为其它数据类型

strcpy(temp,"123");
短整型(int)
   i = atoi(temp);
长整型(long)
   l = atol(temp);
浮点(double)
   d = atof(temp);

四、其它数据类型转换到CString

使用CString的成员函数Format来转换,如:
整数(int)
   str.Format("%d",i);
浮点数(float)
   str.Format("%f",i);
字符串指针(char *)等已经被CString构造函数支持的数据类型可以直接赋值
   str = username;

五、BSTR、_bstr_t与CComBSTR

CComBSTR、_bstr_t是对BSTR的封装,BSTR是指向字符串的32位指针
char *转换到BSTR可以这样:
BSTR b=_com_util::ConvertStringToBSTR("数据"); 
//使用前需要加上头文件comutil.h
反之可以使用char *p=_com_util::ConvertBSTRToString(b);

六、VARIANT 、_variant_t 与 COleVariant

VARIANT的结构可以参考头文件VC98\Include\OAIDL.H中关于结构体tagVARIANT的定义。对于VARIANT变量的赋值:首先给vt成员赋值,指明数据类型,再对联合结构中相同数据类型的变量赋值,举个例子:
VARIANT va;
int a=2001;
va.vt=VT_I4;  //指明整型数据
va.lVal=a;   //赋值

对于不马上赋值的VARIANT,最好先用Void VariantInit(VARIANTARG FAR* pvarg);进行初始化,其本质是将vt设置为VT_EMPTY,下表我们列举vt与常用数据的对应关系:

unsigned char bVal;   VT_UI1
short iVal;           VT_I2
long lVal;            VT_I4
float fltVal;         VT_R4
double dblVal;        VT_R8
VARIANT_BOOL boolVal; VT_BOOL
SCODE scode;          VT_ERROR
CY cyVal;             VT_CY
DATE date;             VT_DATE
BSTR bstrVal;          VT_BSTR
IUnknown FAR* punkVal; VT_UNKNOWN
IDispatch FAR* pdispVal; VT_DISPATCH
SAFEARRAY FAR* parray;   VT_ARRAY|*
unsigned char FAR* pbVal; VT_BYREF|VT_UI1
short FAR* piVal;       VT_BYREF|VT_I2
long FAR* plVal;        VT_BYREF|VT_I4
float FAR* pfltVal;     VT_BYREF|VT_R4
double FAR* pdblVal;    VT_BYREF|VT_R8
VARIANT_BOOL FAR* pboolVal; VT_BYREF|VT_BOOL
SCODE FAR* pscode;      VT_BYREF|VT_ERROR
CY FAR* pcyVal;         VT_BYREF|VT_CY
DATE FAR* pdate;        VT_BYREF|VT_DATE
BSTR FAR* pbstrVal;     VT_BYREF|VT_BSTR
IUnknown FAR* FAR* ppunkVal;   VT_BYREF|VT_UNKNOWN
IDispatch FAR* FAR* ppdispVal; VT_BYREF|VT_DISPATCH
SAFEARRAY FAR* FAR* pparray;   VT_ARRAY|*
VARIANT FAR* pvarVal;          VT_BYREF|VT_VARIANT
void FAR* byref;               VT_BYREF

_variant_t是VARIANT的封装类,其赋值可以使用强制类型转换,其构造函数会自动处理这些数据类型。
如:
long l=222;
int i=100;
_variant_t lVal(l);
lVal = (long)i;

COleVariant的使用与_variant_t的方法基本一样,请参考如下例子:
COleVariant v3 = "字符串", v4 = (long)1999;
CString str =(BSTR)v3.pbstrVal;
long i = v4.lVal;

七、其它

对消息的处理中我们经常需要将WPARAM或LPARAM等32位数据(DWORD)分解成两个16位数据(WORD),
如:
LPARAM lParam;
WORD loValue = LOWORD(lParam);  //取低16位
WORD hiValue = HIWORD(lParam);  //取高16位

对于16位的数据(WORD)我们可以用同样的方法分解成高低两个8位数据(BYTE),
如:
WORD wValue;
BYTE loValue = LOBYTE(wValue);  //取低8位
BYTE hiValue = HIBYTE(wValue);  //取高8位

如何将CString类型的变量赋给char*类型的变量

1、GetBuffer函数:

使用CString::GetBuffer()
char *p;
CString str="hello";
p=str.GetBuffer(str.GetLength());
str.ReleaseBuffer();

将CString转换成char * 时
CString str("aaaaaaa");

strcpy(str.GetBuffer(10),"aa");
str.ReleaseBuffer();
当我们需要字符数组时调用GetBuffer(int n),其中n为我们需要的字符数组的长度.使用完成后一定要马上调用ReleaseBuffer();
还有很重要的一点就是,在能使用const char *的地方,就不要使用char *

2、memcpy:

CString mCS=_T("cxl");
char mch[20];
memcpy(mch,mCS,20);

3、用LPCTSTR强制转换: 尽量不使用

char *ch;
CString str;
ch=(LPSTR)(LPCTSTR)str;

CString str = "good";
char tmp[50];
sprintf(tmp,"%s",(LPTSTR)(LPCTSTR)str);

4、
CString Msg;
Msg=Msg+"abc";
LPTSTR lpsz;
lpsz = new TCHAR[Msg.GetLength()+1];
_tcscpy(lpsz, Msg);
char psz[50];
strcpy(psz,lpsz);

CString类向const char *转换
char a[100];
CString str("aaaaaa");
strncpy(a,(LPCTSTR)str,sizeof(a));或strncpy(a,str,sizeof(a));   
以上两种用法都是正确地. 因为strncpy的第二个参数类型为const char *.所以编译器会自动将CString类转换成const char *.

CString转LPCTSTR (const char *)
CString cStr;
const char *lpctStr=(LPCTSTR)cStr;

LPCTSTR转CString
LPCTSTR lpctStr;
CString cStr=lpctStr;

将char*类型的变量赋给CString型的变量可以直接赋值,如:    CString myString = "This is a test"; 也可如: CString s1("Tom");

将CString类型的变量赋给char[]类型(字符串)的变量

1、sprintf()函数
CString str = "good";
char tmp[200] ;
sprintf(tmp, "%s",(LPCSTR)str);
(LPCSTR)str这种强制转换相当于(LPTSTR)(LPCTSTR)str
CString类的变量需要转换为(char*)的时,使用(LPTSTR)(LPCTSTR)str
然而LPCTSTR是const char *,也就是说,得到的字符串是不可写的!将其强制转换成LPTSTR去掉const,是极为危险的!一不留神就会完蛋!要得到char *,应该用GetBuffer()或GetBufferSetLength(),用完后再调用ReleaseBuffer()。

2、strcpy()函数
CString str;
char c[256];
strcpy(c, str);
char mychar[1024];
CString source="Hello";
strcpy((char*)&mychar,(LPCTSTR)source);

关于CString的使用

1、指定 CString 形参
   对于大多数需要字符串参数的函数,最好将函数原型中的形参指定为一个指向字符(LPCTSTR)而非 CString 的const指针。
   当将形参指定为指向字符的const指针时,可将指针传递到 TCHAR 数组(如字符串 ["hi there"])或传递到 CString 对象。
   CString对象将自动转换成LPCTSTR。任何能够使用LPCTSTR的地方也能够使用 CString对象。
2、如果某个形参将不会被修改,则也将该参数指定为常数字符串引用(即const CString&)。如果函数要修改该字符串,则删除const修饰符。如果需要默认为空值,则将其初始化为空字符串 [""],如下所示:
void AddCustomer(const CString& name,const CString& address,const CString& comment = "" );
3、对于大多数函数结果,按值返回 CString 对象即可。


c++ 字符类型总结

1.区别wchar_t,char,WCHAR

  ANSI:即char,可用字符串处理函数:strcat( ),strcpy( ), strlen( )等以str打头的函数。
  UNICODE:wchar_t是Unicode字符的数据类型,它实际定义在里:
  typedef unsigned short wchar_t;
  另外,在头文件中有这样的定义:typedef wchar_t WCHAR; 所以WCHAR实际就是wchar_t。
  wchar_t可用字符串处理函数:wcscat(),wcscpy(),wcslen()等以wcs打头的函数。为了让编译器识别Unicode字符串,必须以在前面加一个“L”,例如: wchar_t *szTest=L"This is a Unicode string.";
2.TCHAR

  在C语言里面提供了_UNICODE宏(有下划线),在Windows里面提供了UNICODE宏(无下划线),只要定了_UNICODE宏和UNICODE宏,系统就会自动切换到UNICODE版本,否则,系统按照ANSI的方式进行编译和运行。只定义了宏并不能实现自动的转换,还需要一系列的字符定义支持。

  1. TCHAR
  如果定义了UNICODE宏则TCHAR被定义为wchar_t。
  typedef wchar_t TCHAR;
  否则TCHAR被定义为char typedef char TCHAR;
  2. LPTSTR
  如果定义了UNICODE宏则LPTSTR被定义为LPWSTR。
  typedef LPTSTR LPWSTR;
  否则TCHAR被定义为char typedef LPTSTR LPSTR;

  说明:在使用字符串常量的时候需要使用_TEXT(“MyStr”)或_T("")来支持系统的自动转换。
  3.BSTR
  BSTR是一个带长度前缀的字符串,主要由操作系统来管理的,所以要用api.主要用来和VB打交道的(VB里的string就是指它)要操作它的API函数有很多.比如SysAllocString,SysFreeString等等.
  vc里封装它的类如_bstr_t,及ATL中的CComBSTR等.
   一个BSTR由头部和字符串组成,头部包含了字符串的长度信息,字符串中可以包含嵌入的 null 值。
   BSTR是以指针的形式进行传递的。(指针是一个变量,包含另外一个变量的内存地址,而不是数据。) BSTR是Unicode的,即每个字符需要两个字节。BSTR通常以两字节的 null 字符结束。 wstr是宽字符,以双字节表示一个字符 bstr是为了与原先的basic字符兼容,它的最前面的4个字节为其长度,以'\0'结束.
4.更进一步的字符串以及其指针的类型定义
   由于Win32API文档的函数列表使用函数的常用名字 ( 如, "SetWindowText"),所有的字符串都是用TCHAR来定义的。(除了XP中引入的只适用于Unicode的API)。下面列出一些常用的typedefs,你可以在msdn中看到他们。
type       Meaning in MBCS builds      Meaning in Unicode builds

WCHAR       wchar_t                         wchar_t
LPSTR       char*                           char*
LPCSTR      const char*                     const char*
LPWSTR      wchar_t*                        wchar_t*
LPCWSTR     wchar_t*                        wchar_t*
TCHAR       TCHAR                           char wchar_t
LPTSTR      TCHAR*                          TCHAR*
LPCTSTR     const TCHAR*                    const TCHAR*

5.相互转换
(1) char*转换成CString
  若将char*转换成CString,除了直接赋值外,还可使用CString::Format进行。如:
char chArray[] = "This is a test";
char * p = "This is a test";  或    LPSTR p = "This is a test";

  或在已定义Unicode应的用程序中
TCHAR * p = _T("This is a test");  或  LPTSTR p = _T("This is a test");
CString theString = chArray;
theString.Format(_T("%s"), chArray);
theString = p;

(2) CString转换成char*

  若将CString类转换成char*(LPSTR)类型,常使用下列三种方法:

1,使用强制转换。如:
CString theString( "This is a test" );
LPTSTR lpsz =(LPTSTR)(LPCTSTR)theString;
2,使用strcpy。如:
CString theString( "This is a test" );
LPTSTR lpsz = new TCHAR[theString.GetLength()+1];
_tcscpy(lpsz, theString);
需要说明的是,strcpy(或可移值Unicode/MBCS的_tcscpy)的第二个参数是 const wchar_t* (Unicode)或const char* (ANSI),系统编译器将会自动对其进行转换。
3,使用CString::GetBuffer。如:
CString s(_T("This is a test "));
LPTSTR p = s.GetBuffer();
// 在这里添加使用p的代码
if(p != NULL) *p = _T('\0');
s.ReleaseBuffer();
// 使用完后及时释放,以便能使用其它的CString成员函数

(3) BSTR转换成char*
方法一 ,使用ConvertBSTRToString。例如:
#include
#pragma comment(lib, "comsupp.lib")
int _tmain(int argc, _TCHAR* argv[])
{
    BSTR bstrText = ::SysAllocString(L"Test");
    char* lpszText2 = _com_util::ConvertBSTRToString(bstrText);
    SysFreeString(bstrText); // 用完释放
    delete[] lpszText2;
    return 0;
}
方法二,使用_bstr_t的赋值运算符重载。例如:
   _bstr_t b = bstrText;
   char* lpszText2 = b;

(4) char*转换成BSTR
方法一,使用SysAllocString等API函数。例如:
BSTR bstrText = ::SysAllocString(L"Test");
BSTR bstrText = ::SysAllocStringLen(L"Test",4);
BSTR bstrText = ::SysAllocStringByteLen("Test",4);

方法二,使用COleVariant或_variant_t。例如:
//COleVariant strVar("This is a test");
_variant_t strVar("This is a test");
BSTR bstrText = strVar.bstrVal;

方法三,使用_bstr_t,这是一种最简单的方法。例如:
BSTR bstrText = _bstr_t("This is a test");

方法四,使用CComBSTR。例如:

BSTR bstrText = CComBSTR("This is a test"); 或  CComBSTR bstr("This is a test");
BSTR bstrText = bstr.m_str;

方法五,使用ConvertStringToBSTR。例如:
char* lpszText = "Test";
BSTR bstrText = _com_util::ConvertStringToBSTR(lpszText);

(5) CString转换成BSTR

  通常是通过使用CStringT::AllocSysString来实现。例如:
CString str("This is a test");
BSTR bstrText = str.AllocSysString();

SysFreeString(bstrText); // 用完释放

(6) BSTR转换成CString

  一般可按下列方法进行:
BSTR bstrText = ::SysAllocString(L"Test");
CStringA str;
str.Empty();
str = bstrText;   或  CStringA str(bstrText);

(7) ANSI、Unicode和宽字符之间的转换

一,使用MultiByteToWideChar将ANSI字符转换成Unicode字符,
     用WideCharToMultiByte将Unicode字符转换成ANSI字符。
二,使用“_T”将ANSI转换成“一般”类型字符串,使用“L”将ANSI转换成 Unicode,而在托管C++环境中还可使用S将ANSI字符串转换成String*对象。
如:
TCHAR tstr[] = _T("this is a test");
wchar_t wszStr[] = L"This is a test";
String* str = S”This is a test”;
三,使用ATL 7.0的转换宏和类。ATL7.0在原有3.0基础上完善和增加了许多字符串转换宏以及提供相应的类,它具有如图3所示的统一形式:
  其中,第一个C表示“类”,以便于ATL 3.0宏相区别,第二个C表示常量,2表示“to”,EX表示要开辟一定大小的缓冲。SourceType和DestinationType可以是A、 T、W和OLE,其含义分别是ANSI、Unicode、“一般”类型和OLE字符串。
  如,CA2CT就是将ANSI转换成一般类型的字符串常量。
下面是一些示例代码:
LPTSTR tstr= CA2TEX<16>("this is a test");
LPCTSTR tcstr= CA2CT("this is a test");
wchar_t wszStr[] = L"This is a test";
char* chstr = CW2A(wszStr);