摘要:
2、爬虫数据解析的三方式 一.正则表达式解析 常用正则表达式回顾: 官方文档 点击这里 单字符: . : 除换行以外所有字符 [] :[aoe] [a-w] 匹配集合中任意一个字符 \d :数字 [0-9] \D : 非数字 \w :数字、字母、下划线、中文 \W : 非\w \s :所有的空白字符 阅读全文
posted @ 2019-03-03 15:17
传盛
阅读(398)
评论(0)
推荐(0)
摘要:
一,什么是爬虫? 描述: 本质是一个自动化程序,一个模拟浏览器向某一个服务器发送请求获取响应资源的过程. 爬虫的基本流程 robots.txt协议 编写一个robots.txt的协议文件来约束爬虫程序的数据爬取。 二,http协议 import requests '''1,GET:GET可以说是最常 阅读全文
posted @ 2019-03-03 14:31
传盛
阅读(182)
评论(0)
推荐(0)
浙公网安备 33010602011771号