摘要: 前言 这两年,新冠肺炎肆虐而来,随着确诊人数的不断上升,全世界的人都陷入了恐慌中。我们经常能在手机、电视上看到各个地区疫情的情况,但那些数据大多数都是零碎的,我们不可能去记住每个数据,但我们可以用爬虫爬取各个地区发出的新闻数据,再将这些数据进行整理分析。所以我们在疫情期间可以通过访问一个网站,就能知 阅读全文
posted @ 2021-06-12 22:26 yusama 阅读(2907) 评论(3) 推荐(1) 编辑
摘要: 前言 爬取的数据是:豆瓣电影TOP250 使用的python库有:requests、bs4的BeautifulSoup、pandas。 通过requests爬取网页数据,通过BeautifulSoup解析网页数据,通过pandas将数据保存成excel、csv格式。 爬虫代码 import requ 阅读全文
posted @ 2021-05-14 22:01 yusama 阅读(197) 评论(0) 推荐(0) 编辑
摘要: 文章的分类 阅读全文
posted @ 2021-04-20 09:34 yusama 阅读(41) 评论(0) 推荐(0) 编辑
摘要: 我们在分析数据之前要清洗数据,通过Python的Pandas库来对数据进行清洗,清除空值,重复值等。 再用Pandas的图形函数进行数据分析。 阅读全文
posted @ 2021-04-17 21:02 yusama 阅读(593) 评论(0) 推荐(0) 编辑