摘要: 一.主题式网络主题式网络爬虫设计方案 1.爬虫名称:爬取豆瓣电影前20 2.爬虫爬取的内容:爬取豆瓣电影前20数据。 3.网络爬虫设计方案概述:实现思路:通过访问网页源代码,使用soup.find_all正则表达爬取数据,对数据进行保存数据,再对数据进行清洗和处理,数据分析与可视化处理。技术难点:经 阅读全文
posted @ 2020-09-29 13:29 崔欣宇 阅读(409) 评论(0) 推荐(0) 编辑
摘要: import reimport timeimport jsonimport datetimeimport requestsimport pymysqlimport pandas as pd class VirusSupervise(object): def __init__(self): self. 阅读全文
posted @ 2020-03-21 23:13 崔欣宇 阅读(594) 评论(0) 推荐(0) 编辑