摘要: 一.主题式网络爬虫设计方案 1.主题式网络爬虫名称:关于携程景区信息 2.主题式网络爬虫爬取的内容:景区福利评级与热度 3.设计方案概述: 实现思路:爬取网站内容,之后分析提取需要的数据,进行数据清洗,之后数据可视化,并计算不同比率的相关系数 技术难点:因为用的是json分析,所以需要通过查找的方式 阅读全文
posted @ 2020-04-14 22:38 和耀权 阅读(654) 评论(0) 推荐(0)
摘要: 查看源代码 标签 #获取各书的id import re import requests def book_list(): url = 'https://www.qidian.com/rank' # 打开相应url并把页面作为返回 html = requests.get(url).text print 阅读全文
posted @ 2020-03-19 23:14 和耀权 阅读(348) 评论(0) 推荐(0)