python爬虫之——爬取天气信息

初学爬虫,不足之处请见谅

官网:
在这里插入图片描述
查询源代码
看到想要爬取的信息都在<li>标签下
先爬取<li>标签

正则匹配信息:

<li class="sky skyid lv[1-3]( on)?">(.+?)</li>
get(url).content.decode('utf-8')# 如果没指定会是乱码
#  coding : UTF-8
from requests import *
from re import *
# 导入模块,每次使用模块中的函数,直接使用函数就可以了;注因为已经知道该函数是那个模块中的了。

url = 'http://www.weather.com.cn/weather/101230506.shtml'
r = str(get(url).content.decode('utf-8')).replace('\n', '')
# 正则匹配
reg = compile(r'<li class="sky skyid lv[1-3]( on)?">(.+?)</li>')

for i in findall(reg , r):
    print (i[1])

运行python:
在这里插入图片描述
替换一下得到结果

sublime 中用正则 去除空行、html注释和js注释
在这里插入图片描述

posted @ 2022-03-03 16:39  mingyepf  阅读(175)  评论(0)    收藏  举报