摘要: 一、设计方案1.主题式网络爬虫名称:微博热搜榜前20信息数据爬取进行数据分析与可视化2.爬取内容与数据特征分析:爬取微博热搜榜前20热搜事件、排名与热度,数据呈一定规律排序。3.设计方案概述:思路:首先打开目标网站,运用开发工具查看源代码,寻找数据标签,通过写爬虫代码获取所要的数据,将数据保存为cs 阅读全文
posted @ 2020-04-22 01:06 冯汐辰 阅读(4032) 评论(0) 推荐(0) 编辑
摘要: 一、设计方案 1.主题式网络爬虫名称:爬取B站全站日榜前20数据进行数据分析与可视化2.爬取内容与数据特征分析:爬取B站日榜排名前20数据包括排名、事件、热度,数据未呈一定规律排序。3.设计方案概述:思路:首先打开目标网站,运用工具查看源代码,寻找数据标签,通过写爬虫代码爬取所要的数据,将数据保存为 阅读全文
posted @ 2020-04-22 00:40 冯汐辰 阅读(1030) 评论(0) 推荐(0) 编辑
摘要: import requestsimport bs4 url = "https://search.bilibili.com/all?keyword=%E7%BA%AA%E5%BD%95%E7%89%87"header={'User-Agent':""}de = requests.get(url)de. 阅读全文
posted @ 2020-03-21 20:00 冯汐辰 阅读(310) 评论(0) 推荐(0) 编辑