Fork me on GitHub
摘要: 一 说明 Python语言的爬虫开发相对于其他编程语言是极其高效的,在上一篇文章 爬虫抓取博客园前10页标题带有Python关键字(不区分大小写) 的文章中,我们介绍了使用requests做爬虫开发,它能处理简单 的任务,也是入门爬虫最简单的方式。接下来我们将为大家介绍使用 beautiful so 阅读全文
posted @ 2020-07-24 17:24 马一特 阅读(729) 评论(0) 推荐(0) 编辑
摘要: 写一个简易的爬虫程序,抓取博客园网站首页前10页中所有文章标题带有Python关键字(不区分大小写)的文章,并把文章链接和文章标题存入硬盘,要求如下: 使用正则表达式匹配出需要的数据,然后对数据进行解析 程序中很明显有多个任务,这多个任务必须是异步调用 任务的返回值要及时处理,不能等所有任务都执行完 阅读全文
posted @ 2020-07-24 17:11 马一特 阅读(479) 评论(0) 推荐(0) 编辑