摘要:
上午刚入手的小说,下午心血来潮想从网站上拉取下来做成电子书,呵呵,瞎折腾~说做就做~【抓包】这一步比什么都重要,如果找不到获取真正资源的那个请求,就什么都不用做了~先是打算用迅雷把所有页面都下载下来然后本地处理,结果发现保存下来的页面都只有界面没有内容~看了看Javascript的代码,原来是ready的时候再ajax发送post到另一个网址取内容。于是再抓包核实一下。抓包工具真难搞,试了两三个都没成功,最后还是用firefox搞定了~打开页面共发送了50个请求,不过post只有两个,很快就看到http包的内容了。【写程序拉取】网址,请求的header,表单 都具备了,还等什么,赶紧码字爬取啦 阅读全文
posted @ 2014-03-03 18:47
程序猿攻城狮
阅读(1082)
评论(0)
推荐(0)
浙公网安备 33010602011771号