摘要: 一:网络爬虫设计方案 爬虫名称:分析小说长度对阅读者的影响 设计方案概述: 1.找到要爬取的网页,使用F12查看源代码,找到我们要爬取的数据 2.使用get请求和beautifulsoup解析工具进行爬取数据 3.使用pandas进行数据可视化 4.使用matplotlib进行数据分析以及回归方程的 阅读全文
posted @ 2020-04-17 19:17 ohhh 阅读(487) 评论(0) 推荐(0) 编辑
摘要: import requests#用于请求网页from bs4 import BeautifulSoup#用于解析网页import pandas as pdurl=url="http://top.baidu.com/buzz.php?p=top_keyword"headers = {'User-Age 阅读全文
posted @ 2020-03-20 20:13 ohhh 阅读(248) 评论(0) 推荐(0) 编辑