摘要: 一、网络爬虫设计方案 1、爬虫名称:百度汽车热搜 2、内容:爬取百度不同汽车的热搜指数 3、概述:首先查找源代码,分析请求方式和url地址,再使用requests模块获取网页源代码,再使用BeautifulSoup解析得到所需要的数据,然后使用matplotlib实现数据可视化分析,最后进行小结。 阅读全文
posted @ 2020-04-19 16:13 罗瑞祥 阅读(2479) 评论(0) 推荐(0) 编辑
摘要: 1.打开网站http://top.baidu.com/buzz?b=1&fr=topindex 2.右键找到源代码 3.用工具爬取数据 import requests from bs4 import BeautifulSoup import pandas as pd titles=[] hots=[ 阅读全文
posted @ 2020-03-20 14:06 罗瑞祥 阅读(988) 评论(0) 推荐(0) 编辑