摘要: 写爬虫最重要的就是正则表达式的处理(爬出来的数据的筛选,清洗,过滤等操作)。 通过一篇文章 http://blog.csdn.net/quaful/article/details/6460880 来确定使用pcre来实现c的正则表达式操作。 阅读全文
posted @ 2017-04-24 15:06 dspeeding 阅读(201) 评论(0) 推荐(0) 编辑
摘要: 打算用c语言和libcurl库在windows下实现一些爬虫操作。 一、编译libcurl 1、编译zlib 1)下载zlib http://sourceforge.net/projects/libpng/files/zlib/ 找到最新版下载,这里我下载的是1.2.11版本 2)打开 cmd 切换 阅读全文
posted @ 2017-04-24 14:58 dspeeding 阅读(471) 评论(0) 推荐(0) 编辑