摘要: 哔哩哔哩热榜爬虫程序及数据处理 完整的代码与结果在最下面 一、设计方案 1.爬虫的目标是哔哩哔哩排行榜上视频的信息(https://www.bilibili.com/ranking/all/0/1/7) 2.爬取的内容包括网页上显示的所有内容,有排名标题,播放量,弹幕数,up,得分以及视频的url 阅读全文
posted @ 2021-09-05 10:48 李豹。 阅读(285) 评论(0) 推荐(0) 编辑
摘要: 爬取2020年9月23日的百度热搜风云榜 设计方案 1.目标是爬取百度搜索风云榜 2.对爬取的数据进行数据清洗 3.清洗后数据的分析和可视化 实现思路:1.到所要爬取的网页使用f12查看源代码,查取所要爬取的数据的路据 2.使用get或post进行数据的爬取 3.提取有用的数据 4.使用pandas 阅读全文
posted @ 2020-09-23 23:46 李豹。 阅读(190) 评论(0) 推荐(0) 编辑
摘要: 1.目标爬取百度热搜榜(百度热搜榜网址:https://top.baidu.com) 2.对爬取的数据进行清洗和分析 爬取网站的“关键词”“相关链接”“搜索指数” 3.进行数据可视化 实现思路:1.到该网页使用f12查看源代码,查找所要爬取的数据。 2.使用get或post进行数据爬取。 3.提取有 阅读全文
posted @ 2020-04-24 21:23 李豹。 阅读(1403) 评论(0) 推荐(0) 编辑
摘要: 1.目标爬取百度热搜榜(百度热搜榜网址:https://top.baidu.com) 2.对爬取的数据进行清洗和分析 爬取网站的“关键词”“相关链接”“搜索指数” 3.进行数据可视化 实现思路:1.到该网页使用f12查看源代码,查找所要爬取的数据。 2.使用get或post进行数据爬取。 3.提取有 阅读全文
posted @ 2020-04-24 19:29 李豹。 阅读(255) 评论(0) 推荐(0) 编辑