2016年8月25日

网络爬虫:使用Scrapy框架编写一个抓取书籍信息的爬虫服务

摘要: 上周学习了BeautifulSoup的基础知识并用它完成了一个网络爬虫( 使用Beautiful Soup编写一个爬虫 系列随笔汇总 ), BeautifulSoup是一个非常流行的Python网络抓取库,它提供了一个基于HTML结构的Python对象。 虽然简单易懂,又能非常好的处理HTML数据, 阅读全文

posted @ 2016-08-25 10:35 backslash112 阅读(12916) 评论(8) 推荐(2) 编辑

使用Beautiful Soup编写一个爬虫 系列随笔汇总

摘要: 这几篇博文只是为了记录学习Beautiful Soup的过程,不仅方便自己以后查看,也许能帮到同样在学习这个技术的朋友。通过学习Beautiful Soup基础知识 完成了一个简单的爬虫服务:从allitebooks.com抓取书籍的书名和每本书对应的ISBN码,然后通过ISBN码去amazon.c 阅读全文

posted @ 2016-08-25 09:57 backslash112 阅读(1222) 评论(0) 推荐(0) 编辑

导航