代码改变世界

解决p42svn中文log乱码的问题

2009-05-23 16:30  setsail_wu  阅读(243)  评论(0编辑  收藏  举报

现象:

 

  将perforce代码库迁移至SVN时log乱码。

  p42svn.pl在windows下运行至"-|"时会报错,于是安装了linux虚拟机,从虚拟linux中运行p42svn.pl生成dump文件,再传至windows下用svnadmin load。可是在svn查看log时,中文却是显示乱码。

 

解决过程:

     最开始是怀疑perl对中文的支持,于是在网上查资料,了解到perl是用utf8字符流,看了《Perl对中文的处理问题》http://blog.chinaunix.net/u2/70049/showart_1225418.html才明白,于是修改p42svn.pl。

 文件刚开始部份加上

use Encode;

 将
    $result{'log'}  = $change->{'desc'} ;

   改成
    $result{'log'}  = decode("GBK", $change->{'desc'} );

这时生成的dump文件却无法load。

    测试二, 用svnadmin dump出带中文log的记录,再load进版本库是正常的。比较查看svnadmin与p42svn.pl生成的dump文件,发现log部分一样,但是Prop-content-length、Content-length与log的V值不一样。在网上游荡了半天,看到一篇文章《PERL unicode》http://longer.spaces.eepw.com.cn/articles/article/item/48773才知道是perl取出的字符数而不是字节数,而svnadmin却是要求字节数的。于是再次修改p42svn.pl


     $result .= sprintf("V %d/n%s/n", length($val), $val);

前加上

     Encode::_utf8_off($val);


    my $ppty_len = length($ppty_txt) + 1;

前加上

    Encode::_utf8_off($ppty_txt);

这样就解决log乱码的问题。

 

具体代码p42svn下载地址:http://download.csdn.net/source/1342570