2012 年 6月 17 日随笔档案 - 有来有去

2012年6月17日

摘要：上一篇《用C#实现网络爬虫（一）》我们实现了网络通信的部分，接下来继续讨论爬虫的实现3. 保存页面文件这一部分可简单可复杂，如果只要简单地把HTML代码全部保存下来的话，直接存文件就行了。 1 private void SaveContents(string html, string url) 2 { 3 if (string.IsNullOrEmpty(html)) //判断html字符串是否有效 4 { 5 return; 6 } 7 string path = string.Format("{0}\\{1}.txt", _path, _in... 阅读全文

posted @ 2012-06-17 11:34 有来有去阅读(33029) 评论(54) 推荐(28)

公告