摘要: 一、主题式网络爬虫设计方案 1.主题式网络爬虫名称: 爬取豆瓣电影排名2.主题式网络爬虫爬取的内容与数据特征分析:主要爬取 豆瓣电影评分 3.主题式网络爬虫设计方案概述(包括实现思路与技术难点) 实现思路为先对网页源代码分析,用BeautifulSoup对数据进行清洗,最后通过进行数据可视化。技术难 阅读全文
posted @ 2020-04-23 17:24 郑泉 阅读(1270) 评论(0) 推荐(0) 编辑
摘要: import requests from bs4 import BeautifulSoup url = "https://tophub.today/n/74KvxwokxM" headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) 阅读全文
posted @ 2020-03-21 19:19 郑泉 阅读(210) 评论(0) 推荐(0) 编辑