摘要: 一.主题式网络爬虫设计方案 1.主题式网络爬虫名称:国家数据网不同年份的人口比率 2.主题式网络爬虫爬取的内容:人口出生率死亡率及自然增长率 3.设计方案概述: 实现思路:爬取网站内容,之后分析提取需要的数据,进行数据清洗,之后数据可视化,并计算不同比率的相关系数 技术难点:因为用的是json分析, 阅读全文
posted @ 2020-04-05 12:49 周宇泽 阅读(840) 评论(0) 推荐(0)
摘要: 1 import requests 2 from bs4 import BeautifulSoup 3 import pandas as pd 4 import numpy as np 5 import json 6 headers = {'user-agent': 'Mozilla/5.0 (Wi 阅读全文
posted @ 2020-03-18 21:36 周宇泽 阅读(318) 评论(0) 推荐(0)