国务院办公厅放假通知信息获取

Python爬虫之正则提取信息

有时候我们需要用到根据当前日期(或指定日期)获取是否为节假日的情况,网上找的接口突然开始收费了,怎么办呢。我们就从国家官方网站获取信息吧。

需求:从中华人民共和国中央人民政府网站(www.gov.cn)获取2022年节假日安排 提取具体的放假日期和调休上班数据

第一步:首先确定目标数据

打开中华人民共和国中央人民政府网站(www.gov.cn)网站,进入搜索页面,搜索 “国务院办公厅关于2022年部分节假日安排的通知”

UntitledImage

然后点击搜索结果中的第一条通知,详情如下,至此找到目标内容。

UntitledImage

第二步:根据目标内容进行二次处理,从中提取出我们需要的数据。

分析:放假部分信息,[*年]*月*日至[*年][*月]*日放假;上班部分信息:*月*日(星期*)、*月*日(星期*)上班

第三步:根据上述逻辑开始转化为代码。

爬取结果如下:

UntitledImage

至此,节假日放假安排数据已获取到并进行了处理,以便我们进行其它操作。

 

posted @ 2022-06-11 13:46  逸乐太子  阅读(619)  评论(0编辑  收藏  举报