python爬虫之——爬取天气信息
初学爬虫,不足之处请见谅
官网:

查询源代码
看到想要爬取的信息都在<li>标签下
先爬取<li>标签
正则匹配信息:
<li class="sky skyid lv[1-3]( on)?">(.+?)</li>
get(url).content.decode('utf-8')# 如果没指定会是乱码
# coding : UTF-8
from requests import *
from re import *
# 导入模块,每次使用模块中的函数,直接使用函数就可以了;注因为已经知道该函数是那个模块中的了。
url = 'http://www.weather.com.cn/weather/101230506.shtml'
r = str(get(url).content.decode('utf-8')).replace('\n', '')
# 正则匹配
reg = compile(r'<li class="sky skyid lv[1-3]( on)?">(.+?)</li>')
for i in findall(reg , r):
print (i[1])
运行python:

替换一下得到结果


浙公网安备 33010602011771号