2013年11月17日

linux exec命令

摘要: 今天在用python做爬虫后需要merge文件,但是由于在设计阶段没有考虑各网站编码的不统一,所以导致merge出来的文件格式乱的。后来想到用shell来解决这个问题。比如我需要将title目录下的文件编码转换后放到/gbk/目录下find . -type -f -exec iconv -c -f utf-8 -t gbk {} -o /gbk{} \;加上-c是因为在conv过程中有可能编码失败,需要ignore,类似python的 decode('utf-8',ignore).encode('gbk')find命令详解find . -name "* 阅读全文

posted @ 2013-11-17 00:40 无为在歧路 阅读(5891) 评论(0) 推荐(1) 编辑

常用正则搜集整理

摘要: 常用正则表达式大全! 阅读全文

posted @ 2013-11-17 00:25 无为在歧路 阅读(263) 评论(0) 推荐(0) 编辑

导航