摘要:
http://www.cnblogs.com/justwannaloveyou/archive/2010/10/24/1859645.html抓取和分析网页的类。主要功能有:1、提取网页的纯文本,去所有html标签和javascript代码2、提取网页的链接,包括href和frame及iframe3、提取网页的title等(其它的标签可依此类推,正则是一样的)4、可以实现简单的表单提交及cookie保存/** Author:Sunjoy at CCNU* 如果您改进了这个类请发一份代码给我(ccnusjy 在gmail.com)*/usingSystem;usingSystem.Data;us 阅读全文
posted @ 2011-10-18 13:18
张纯睿
阅读(133)
评论(0)
推荐(0)
摘要:
<?xml version="1.0" encoding="UTF-8"?><config> <needLogin>0</needLogin></config> 阅读全文
posted @ 2011-10-18 12:31
张纯睿
阅读(110)
评论(0)
推荐(0)
摘要:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml"><head><meta http-equiv="Content-Type" content="text/html; charset=gb23 阅读全文
posted @ 2011-10-18 11:23
张纯睿
阅读(159)
评论(0)
推荐(0)
浙公网安备 33010602011771号