Asp.net 数据采集基类(远程抓取,分解,保存,匹配)

昨天因为接到做采集程序的任务,之前到是用过不少采集程序,但从没有自己动手做过,

要做起来还真有点无从下手.但任务下来就得完成.马上开始google,baidu...

搜出来的最多的就是我要发的这个基类...好东西..但网上到处都是.都不知道原创是哪的了.

反正很谢谢写这个类的大哥.帮了我的大忙.呵呵....

现在把这个类发这里一是给自己备忘,二是让有需要的人尽可能的搜到..

 

 

  1using System;
  2using System.Data;
  3using System.Configuration;
  4using System.Web;
  5using System.Web.Security;
  6using System.Web.UI;
  7using System.Web.UI.WebControls;
  8using System.Web.UI.WebControls.WebParts;
  9using System.Web.UI.HtmlControls;
 10using MSXML2;  //这个需要添加引用MSXML2
 11using System.Text.RegularExpressions;
 12namespace EC
 13{
 14    /// <summary>
 15    /// 远程文件抓取类
 16    /// </summary>

 17    public class GetRemoteObj
 18    {
 19      
 20        构造与析构函数
 32
 33        IDisposable 成员
 41
 42        日期随机函数
 79
 80        取得文件后缀
108
109        获取远程文件源代码
140
141        保存远程文件
184
185        替换网页中的换行和引号               
215
216        执行正则提取出值        
249
250        替换HTML源代码
281
282        匹配页面的链接
311
312        匹配页面的图片地址
358
359        替换通过正则获取字符串所带的正则首尾匹配字符串
396
397
398    }

399}

400
posted @ 2008-11-12 13:41  梦梦龙龙  阅读(327)  评论(0)    收藏  举报