2013年11月9日
摘要: 转自:http://www.crifan.com/files/doc/docbook/web_scrape_emulate_login/release/html/web_scrape_emulate_login.html摘要本文主要介绍了抓取网站,模拟登陆,抓取动态网页相关的逻辑,原理和如何实现。主要包括:抓取网页,模拟登陆等背后的通用的逻辑和原理以提取songtaste网页中标题为例,详解如何抓取网站并提取网页内容以模拟登陆百度为例,详解如何模拟登陆网站以抓取网易博客帖子中的最近读者信息为例,详解如何抓取动态网页中的内容详解了在模拟登陆和抓取动态网页过程中,如何用对应的网页分析工具,如IE9 阅读全文
posted @ 2013-11-09 21:10 陈孝勇 阅读(2530) 评论(0) 推荐(0)