摘要: 模拟浏览器登陆的基本思路与做法 最近在新建的爬虫、自然语言处理群320349384中讨论模拟登陆的比较多,我接到的技术支持客户中关于这块的问题,尤其是共性的思路问题,非常突出,现简单总结如下,希望对这块感兴趣的人们少走弯路。 模拟登陆, 即指通过程序设计的方式去模拟人为操作浏览器去登陆相关站点的操作过程,从而达到人为操作可以看到的数据的目的。其技术模块总体分为两大块,即一、抓包分析,二、程序模拟实现 一、抓包分析 1) 抓包分析工具:各个浏览器有不同的搭配,看个人习惯了。 我比较推荐用IE9及以上+HttpWatch8.5版本及以上。IE9以上的IE Developer可以方便辅助做之后... 阅读全文
posted @ 2014-03-09 08:34 风未馨 阅读(2839) 评论(0) 推荐(0)