摘要: 一、主题式网络爬虫设计方案 1.主题式网络爬虫名称:酷狗TOP_500排行榜 2.爬取内容:酷狗TOP_排行榜的歌曲排名,歌曲名称和歌曲时间。 数据特征:数据包含面广,可以用分为多组数据进行分析比对。 3.实现思路:通过网站源代码找到要爬取的数据对象,将爬取到数据进行存储再进行绘图和分析。 技术难点 阅读全文
posted @ 2020-04-22 10:03 刘汶岸 阅读(796) 评论(0) 推荐(0)
摘要: 1.打开网站http://top.baidu.com/buzz?b=1&fr=topindex 2.右键找到源代码 3.用工具爬取数据 import requests from bs4 import BeautifulSoup import pandas as pd url="https://top 阅读全文
posted @ 2020-03-21 16:46 刘汶岸 阅读(405) 评论(0) 推荐(0)