摘要: 一.主题式网络主题式网络爬虫设计方案 1.爬虫名称:爬取哔哩哔哩番剧排行榜 2.爬取内容:爬取番剧名称、播放量、评论数、喜欢人数、综合得分。爬取网站:"https://www.bilibili.com/ranking/bangumi/13/0/3" 3.网络爬虫设计方案概述: 思路:通过分析网页源代 阅读全文
posted @ 2020-04-17 02:01 聂新 阅读(1090) 评论(0) 推荐(0) 编辑
摘要: import requests from bs4 import BeautifulSoup import pandas as pd url="http://top.baidu.com/buzz.php?p=hotstocks"#百度今日热搜 headers = {'User-Agent':'Mozi 阅读全文
posted @ 2020-03-17 15:16 聂新 阅读(246) 评论(0) 推荐(0) 编辑