摘要: 一、主题式网络爬虫设计方案1.主题式网络爬虫名称:爬取网易云音乐歌单 2.主题式网络爬虫爬取的内容与数据特征分析 爬取网易云音乐歌单前十页歌单,轻音乐类型的歌单名称、歌单播放量、歌单链接、用户名称。 分析歌单播放量和歌单标题关键词3.主题式网络爬虫设计方案概述(包括实现思路与技术难点) 实现思路:使 阅读全文
posted @ 2020-04-21 14:20 崔奥园 阅读(3443) 评论(0) 推荐(0) 编辑
摘要: import requests from bs4 import BeautifulSoup import time import os import urllib #需要爬取的目标网页 link='https://www.zhihu.com/hot' #对网页进行解析 soup=BeautifulS 阅读全文
posted @ 2020-03-20 10:01 崔奥园 阅读(179) 评论(0) 推荐(0) 编辑