摘要: 一、主题式网络爬虫设计方案(15分)1.主题式网络爬虫名称 豆瓣电影TOP250数据分析2.主题式网络爬虫爬取的内容与数据特征分析 电影的相关类容3.主题式网络爬虫设计方案概述(包括实现思路与技术难点) 思路:对网页进行分析,通过爬虫读取数据存入excel,对数据清洗分析 难点:数据的处理 二、主题 阅读全文
posted @ 2020-04-14 17:31 PlutoTriton 阅读(626) 评论(0) 推荐(0)
摘要: 1.打开网页https://tophub.today/ 2.按Ctrl+U 打开网页源代码 3.找到想要爬取的数据 4. import requests import pandas as pd from bs4 import BeautifulSoup from pandas import Data 阅读全文
posted @ 2020-03-18 17:45 PlutoTriton 阅读(961) 评论(0) 推荐(0)