摘要: 一、主题式网络爬虫设计方案1.主题式网络爬虫名称爬取纵横中文网点击榜月榜 2.主题式网络爬虫爬取的内容与数据特征分析爬取网站的“排名”,“类别”,“书名”,“状态”,“字数”,“点击数”,“作者” 3.主题式网络爬虫设计方案概述(包括实现思路与技术难点)思路:通过分析网页源代码,找出数据所在的标签, 阅读全文
posted @ 2020-04-24 22:42 旧梦荧光笔 阅读(1277) 评论(0) 推荐(0) 编辑
摘要: 1.打开所要爬取的网站:http://www.zongheng.com/rank/details.html?rt=5&d=1(纵横中文网点击榜) 2.打开网页源代码,找到需要的标签进行爬取: 3.导入数据库,编写代码: import requests#引入requests库下载网页from bs4 阅读全文
posted @ 2020-03-21 00:37 旧梦荧光笔 阅读(554) 评论(0) 推荐(0) 编辑