版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明
http://haoren.blogbus.com/logs/2278697.html
前两天写的一个程序里面,发现中文路径扫描有问题,无法得出带有中文路径的文件的CRC值以及文件大小。因为这两个获得都是通过fstream实现的,跟踪了一下发现2005中的fstream对中文路径处理存在BUG。
跟踪后找到问题所在,原来2005中为了让std::wfstream(这个是MS自己搞的东西,C++标准中并未规定有wfstream)的路径支持wchar_t,所有底层函数的路径都是转换成wchar_t来进行操作的。而在此之前VC2003的wfstream并不支持wchar_t作为路径,写STL的人并未使用MS的标准API:MultiByteToWideChar及WideCharToMultiByte来进行wchar_t和char之间的转换,而是用了C库的wcstombos来进行转换。而wcstombos并不像MultiByteToWideChar这样的函数可以在参数中指定代码页设置,它只接受当前全句的locale设置。当全局的locale设置并不为wcstombos所要转换的文字的代码页时,BUG就出现了。
默认的locale设置为ANSI C,通过设置代码页为".936"可以解决中文DBCS到UNICODE的转换。因此,如果要解决这个BUG可以:
setlocale(LC_CTYPE, ".936");
设置全局locale来解决。不过
这样将导致全局的locale改变。wcstombos是标准C库中的函数,并非STL中的库函数,所以无法只用locale类来对它造成单一影响。这么设置的话,有可能std::cout将无法正确输出中文名,造成的影响似乎有点得不偿失。所以这个BUG最好不要用这种方式解决。还是等MS的SP补丁出来看看是否解决了这个问题。在此之前可以考虑用C库的fopen来代替fstream.
最后:上面说过fstream底层都是用wchar_t来处理路径的,如果事先把路径转换成wchar_t传入进去也是可以的,但是这样也会带来一些问题:比如说VC2005以前的编译器将无法编译。
浙公网安备 33010602011771号