随笔分类 -  C#

C#网页爬虫学习笔记(1)
摘要:最近做的东西感觉是各种搜索,这次学习的爬虫技术。爬虫技术,又叫做网络蜘蛛(蚂蚁等),是借助计算机实现人类无法达到的速度不间断的对执行某些任务,在这里我们的目标是获取指定网站中的指定数据。既然要获取数据,我们首先要做的就是与网站取得通信建立连接,C#的System.Web为我们提供了建立通信的方法 HttpWebRequest all_request = (HttpWebRequest)WebRequest.Create(galURL); WebResponse all_response = all_request.GetResponse();HttpWebRequest是像指定网站发送请求,在 阅读全文

posted @ 2013-04-04 15:20 woud 阅读(667) 评论(0) 推荐(0)

一个简单的非递归硬盘文件遍历程序(C#版)
摘要:最近自己在做一个类似于galgame管理器的东西,于是便接触到了硬盘搜索,MS并没有直接给我们去访问搜索的接口,只是在C#中提供了FindFirstFile和FindNextFile让我们去自己构造算法。网上一些比较高效的算法都是采用这个封装的,我自己写的这套非递归文件遍历算法虽然没有那个那么高效吧···不过算是思路简单,随手一写就能用的,而且效率可以接受,采用的是System.IO下的Directory类自带的一些方法。(在我这台机器上该算法扫描7W文件需要15s的时间)先贴出源代码: 1 public static void getAllDir(string 阅读全文

posted @ 2013-04-03 12:23 woud 阅读(792) 评论(1) 推荐(0)

导航