会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
王洁7
博客园
首页
新随笔
联系
订阅
管理
2020年4月23日
爬取微博热搜Top25的数据
摘要: 一、主题式网络爬虫设计方案1.主题式网络爬虫名称:爬取微博热搜Top25的数据2.爬取微博热搜Top25的内容及其热度3.主题式网络爬虫设计方案概述 先分析网页源代码,设置url地址,利用requests库和lxml来获取网页代码,由此来爬取微博热搜数据并采集;然后对数据进行清洗和处理并可视化 技术
阅读全文
posted @ 2020-04-23 20:44 王洁7
阅读(747)
评论(0)
推荐(0)
2020年3月20日
爬取微博热搜榜
摘要: 1.打开微博网页:https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6 2.右键打开网页源代码 3.导入相应的库 4.编写代码 import requests from lxml import etree url="https://
阅读全文
posted @ 2020-03-20 18:54 王洁7
阅读(1019)
评论(0)
推荐(0)
公告