2019年8月26日

摘要: 一.图片懒加载 什么是图片懒加载? 案例分析:抓取站长素材http://sc.chinaz.com/中的图片数据 #!/usr/bin/env python # -*- coding:utf-8 -*- import requests from lxml import etree if __name 阅读全文

posted @ 2019-08-26 22:28 吃着仙人球的松鼠 阅读(219) 评论(0) 推荐(0) 编辑

摘要: 引入 Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用。 警告:非专业使用其他 HTTP 库会导致危险的副作用,包括:安全缺陷症、冗余代码症、重新发明轮子症、啃文档症、抑郁、头疼、甚至死亡。 今日概要 基于requests的get请求 基于requests模块的p 阅读全文

posted @ 2019-08-26 22:26 吃着仙人球的松鼠 阅读(142) 评论(0) 推荐(0) 编辑

摘要: 了解cookie和session - 无状态的http协议 - 如上图所示,HTTP协议 是无状态的协议,用户浏览服务器上的内容,只需要发送页面请求,服务器返回内容。对于服务器来说,并不关心,也并不知道是哪个用户的请求。对于一般浏览性的网页来说,没有任何问题。 - 但是,现在很多的网站,是需要用户登 阅读全文

posted @ 2019-08-26 22:25 吃着仙人球的松鼠 阅读(205) 评论(0) 推荐(0) 编辑

摘要: 一.正解解析 常用正则表达式回顾: 回顾练习: 项目需求:爬取糗事百科指定页面的糗图,并将其保存到指定文件夹中 #!/usr/bin/env python # -*- coding:utf-8 -*- import requests import re import os if __name__ = 阅读全文

posted @ 2019-08-26 22:22 吃着仙人球的松鼠 阅读(294) 评论(0) 推荐(0) 编辑

摘要: 一.HTTP协议 1.官方概念: HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传送协议。(虽然童鞋们将这条概念都看烂了,但是也没办法,毕竟这就是HTTP的权威官方 阅读全文

posted @ 2019-08-26 21:23 吃着仙人球的松鼠 阅读(86) 评论(0) 推荐(0) 编辑