【原创】最近写的一个比较hack的小爬虫
摘要:
目标:爬取爱漫画上面自己喜欢的一个漫画分析阶段:0、打开爱漫画主页,迎面就是一坨js代码。。直接晕了1、经过抓包和对html源码的分析,可以发现爱漫画通过另外一个域名发送图片,而当前域名中通过js动态生成图片的文件名。问题就在这里了,首先,图片的文件命名模式比较多,没办法通过js源码直接爬;其次,有... 阅读全文
posted @ 2014-10-15 16:51 shadowmydx'sLab 阅读(1136) 评论(0) 推荐(0)
浙公网安备 33010602011771号