摘要: 一、主题式网络爬虫设计方案 1.主题式网络爬虫名称 酷狗TOP500 2.主题式网络爬虫爬取的内容与数据特征分析 内容:主要是爬取酷狗音乐榜单酷狗TOP500的排名、歌手、歌名和歌曲时长 数据特征分析:对酷狗TOP500上歌曲的时长做一个可视化表格 3.主题式网络爬虫设计方案概述(包括实现思路与技术 阅读全文
posted @ 2020-04-18 11:59 杨炜昕 阅读(734) 评论(0) 推荐(0) 编辑
摘要: 页面分析 1.在浏览器中输入百度热搜风云网网址http://top.baidu.com/buzz?b=1&fr=topindex,点击今日热搜 2.查看页面源代码,查询需要的标签属性关键字 3.程序实现 import requests from bs4 import BeautifulSoup im 阅读全文
posted @ 2020-03-20 17:19 杨炜昕 阅读(13542) 评论(0) 推荐(0) 编辑