摘要:
需要记住的,随笔记一下 1、抓取远程网页源码,这里要实现自动判断网页编码,否则有可能抓到乱码。我是先看应答的 http头的chareset,一般这个很准,但像csdn的新闻比较变态http应答的头里的chareset和网页的meta里声明的 chareset不一致,所以我手工加了一下判断,如果不一致 阅读全文
posted @ 2017-05-12 08:20
zheung
阅读(1799)
评论(0)
推荐(0)
浙公网安备 33010602011771号