摘要: 把所有爬虫要实现的功能集成到了一个类里,需要使用的时候,只用新建一个对象,再调用相应的方法即可。下面就分享一天写的这个爬虫类是如何工作的。 1 public: 2 CCrawler(void); 3 ~CCrawler(void); 4 CString GetSubsitesFromPage(CString pageStr);//从页面当中提取出所有的子页面 5 CString GetPageStr(CString url); //得到完整的页面数据,这里就要使用网络连接,为了简便,不把更细的细节分开写 6 CString GenerateUrl(CSt... 阅读全文
posted @ 2012-10-30 14:48 byan 阅读(2067) 评论(0) 推荐(0)