会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
庄园的技术博客
博客园
首页
新随笔
联系
管理
订阅
2010年9月4日
一个小型浏览器架构:HTTP通讯、COOKIE处理、HTML解析、JS模拟、表单处理
摘要: 前段时间作了一个HTML的解析类,方便在蜘蛛、信息发布、小偷程序中正确抓取网页内容。有人可能会说,为啥不用Webbrowser呢。1,首先是效率问题,Webbrowser太慢了。2,你无法操作Webbrowser上传一个文件。3,你无法操作Webbrowser跨域的Iframe4,你不能不按套路出牌,例如页面setTimeout 100秒输出一个div,你也只能100秒后才能获取到。5,如果你只想...
阅读全文
posted @ 2010-09-04 14:42 庄园
阅读(2992)
评论(5)
推荐(1)
编辑
公告