摘要: 一、主题式网络爬虫设计方案(15分)1.主题式网络爬虫名称:爬取人口数据及数据可视化2.主题式网络爬虫爬取的内容与数据特征分析:爬取国家统计局人口数据3.主题式网络爬虫设计方案概述(包括实现思路与技术难点):首先找到爬取页面的源代码,找到所需要爬取的数据在源代码中的位置,接下来进行数据爬取,并将数据 阅读全文
posted @ 2020-04-24 22:09 M20 阅读(1653) 评论(0) 推荐(0) 编辑
摘要: import requestsfrom bs4 import BeautifulSoupimport bs4import pandas as pdtitles=[]h=[]url='http://top.baidu.com/buzz?b=341&c=513&fr=topbuzz_b1_c513' # 阅读全文
posted @ 2020-03-21 23:30 M20 阅读(468) 评论(0) 推荐(0) 编辑