摘要: 一、主题式网络爬虫设计方案 1.主题式网络爬虫名称:BILIBILI番剧热度及排行 2.主题式网络爬虫爬取的内容与数据特征分析:内容为番剧名称,视频总播放量以及综合得分 3.主题式网络爬虫设计方案概述:通过对BILIBILI网页源代码的分析获得所需数据,并进行爬取和整理,从而得出所需结论 二、主题页 阅读全文
posted @ 2020-04-24 20:27 M_google 阅读(1834) 评论(0) 推荐(0) 编辑
摘要: import requestsfrom lxml import etreeimport reimport pandas as pdimport osurl='https://tophub.today/n/mproPpoq6O'header={'User-Agent':""}def get(url): 阅读全文
posted @ 2020-03-21 19:28 M_google 阅读(347) 评论(0) 推荐(0) 编辑