摘要: 淘宝网页中有下面字符:价 格:我最开始用perl试图去除中间的空格时用s/\s//g,发现根本没反应。淘宝的这个空格不是我们想像中的空格!后来我想是不是编码的问题,因为网页的编码是GBK,而perl默认处理的都是UTF-8,所以转了一下。iconv -f GBK -t UTF-8 file1 -o file2将Google香港的Big5编码转换成GBK编码curl -s http://www.google.com.hk/ | iconv -f big5 -t gbk依旧没反应。实际上perl在处理字符串时读入内存的时候已统一转换成了UTF-8编码,不需要我们劳神费心,只是把字符串处理完输出的. 阅读全文
posted @ 2011-06-03 16:25 张朝阳 阅读(4615) 评论(0) 推荐(0) 编辑