摘要: 一.主题式网络主题式网络爬虫设计方案 1.爬虫名称:爬取城市GDP排名 2.爬虫爬取的内容:爬取城市GDP排名 3.网络爬虫设计方案概述:实现思路:在浏览器 中通过F12访问网页源代码,,分析网站源代码,找到自己所需要的数据所在的位置,提取数据,对数据进行保存数据,再对数据进行清洗和处理,数据分析与 阅读全文
posted @ 2020-04-23 11:34 学梓 阅读(1419) 评论(0) 推荐(0) 编辑
摘要: import requests from lxml import etree #爬取知乎热度的前十名 headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like 阅读全文
posted @ 2020-03-21 19:51 学梓 阅读(176) 评论(0) 推荐(0) 编辑