摘要:
爬虫的规定 Robots协议 网站开发者对于网络爬虫的规范的公告,你可以不遵守可能存在法律风险,但尽量去遵守 Robots协议:在网页的根目录+robots.txt Robots协议的基本语法: #注释,*代表所有,/代表根目录 User-agent:* #user-agent代表来源 Allow: 阅读全文
posted @ 2019-07-01 15:40
小小咸鱼YwY
阅读(2194)
评论(2)
推荐(0)
摘要:
Requests库 ` 1.Response对象的属性 属性|说明 : :|: : r.status_code|HTTP请求返回的状态,200表示成功,404表示失败,还有其他的也代表失败 r.text|HTTP响应内容转换成字符串格式 r.content|HTTP响应内容转换成二进制格式 r.en 阅读全文
posted @ 2019-07-01 15:10
小小咸鱼YwY
阅读(1913)
评论(0)
推荐(1)
摘要:
07.01自我总结 常用的re模块的正则匹配的表达式 一、校验数字的表达式 1.数字 2.n位的数字 3.至少n位的数字 4.m n位的数字 5.零和非零开头的数字 6.非零开头的最多带两位小数的数字 7.带1 2位小数的正数或负数 8.正数、负数、和小数 9.有两位小数的正实数 10.有1~3位小 阅读全文
posted @ 2019-07-01 12:11
小小咸鱼YwY
阅读(1391)
评论(0)
推荐(1)