发起请求:headers
获取响应内容:reponse(html、json字符串、二进制数据)然后进行解析,最后保存数据。
正则表达式:对字符串的操作,re库。
re.match 从第一个开始匹配
例:content = hello 123 4567 word this is a regex demo