会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
F863376905
博客园
首页
新随笔
联系
订阅
管理
2020年4月20日
爬取搜狗热搜综艺最红榜的相关信息
摘要: 一.主题式网络爬虫设计方案 1.主题式网络爬虫名称:搜狗热搜榜综艺最红榜排名 2.主题式网络爬虫爬取的内容:综艺最红榜的名称、排名、搜索指数 3.设计方案概述: 实现思路:首先通过爬虫采集搜狗热搜榜的综艺排名数据,并对采集到的数据进行清洗;然后,对清洗后的数据进行可视化分析,探索隐藏在数据背后的规律
阅读全文
posted @ 2020-04-20 14:54 F863376905
阅读(412)
评论(0)
推荐(0)
2020年3月19日
获取知乎的热点前十名的标题信息以及热度数据
摘要: # coding: utf-8 import requests from bs4 import BeautifulSoup headers={"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML,
阅读全文
posted @ 2020-03-19 17:47 F863376905
阅读(346)
评论(1)
推荐(0)
公告