会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
和耀权
博客园
首页
新随笔
联系
订阅
管理
2020年4月14日
携程景区
摘要: 一.主题式网络爬虫设计方案 1.主题式网络爬虫名称:关于携程景区信息 2.主题式网络爬虫爬取的内容:景区福利评级与热度 3.设计方案概述: 实现思路:爬取网站内容,之后分析提取需要的数据,进行数据清洗,之后数据可视化,并计算不同比率的相关系数 技术难点:因为用的是json分析,所以需要通过查找的方式
阅读全文
posted @ 2020-04-14 22:38 和耀权
阅读(654)
评论(0)
推荐(0)
2020年3月19日
爬取起点
摘要: 查看源代码 标签 #获取各书的id import re import requests def book_list(): url = 'https://www.qidian.com/rank' # 打开相应url并把页面作为返回 html = requests.get(url).text print
阅读全文
posted @ 2020-03-19 23:14 和耀权
阅读(348)
评论(0)
推荐(0)
公告