摘要: 一、主题式网络爬虫设计方案1.主题式网络爬虫名称:爬取微博热搜Top25的数据2.爬取微博热搜Top25的内容及其热度3.主题式网络爬虫设计方案概述 先分析网页源代码,设置url地址,利用requests库和lxml来获取网页代码,由此来爬取微博热搜数据并采集;然后对数据进行清洗和处理并可视化 技术 阅读全文
posted @ 2020-04-23 20:44 王洁7 阅读(747) 评论(0) 推荐(0)
摘要: 1.打开微博网页:https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6 2.右键打开网页源代码 3.导入相应的库 4.编写代码 import requests from lxml import etree url="https:// 阅读全文
posted @ 2020-03-20 18:54 王洁7 阅读(1019) 评论(0) 推荐(0)