摘要: 一.主题式网络主题式网络爬虫设计方案 1.爬虫名称:爬取中国大学排名分析 2.爬虫爬取的内容:爬取最好大学网的排名表 3.网络爬虫设计方案概述:主题式网络爬虫设计方案概述:实现思路:选定想要爬取的网页,查看网页源码,找出标签,提取数据,并将数据存入Excel文件中;读取文件数据,对数据进行清洗和处理 阅读全文
posted @ 2020-04-23 20:36 梦幻晨风 阅读(385) 评论(0) 推荐(0)
摘要: import requests import re from bs4 import BeautifulSoup headers={"User-Agent":"","Cookie":""} zh_url = "https://www.zhihu.com/billboard" zh_response = 阅读全文
posted @ 2020-03-21 19:15 梦幻晨风 阅读(167) 评论(0) 推荐(0)