摘要: Cookie 当我们在淘宝上进行登录,购买东西的时候,用户登录的状态是必须要有的。工作当中是需要这个状态的,但是http协议是不负责维持这个状态的。所以,浏览器就想了个办法,搞了一个本地化存储,来保持这个状态。本地保存的这个东西,每次发送请求的时候,浏览器会自动携带该信息。这个本地化的存储,我们就叫 阅读全文
posted @ 2025-05-10 08:33 生而自由爱而无畏 阅读(16) 评论(0) 推荐(0)
摘要: urllib与requests 一、urllib的学习 学习目标 了解urllib的基本使用 1、urllib介绍 除了requests模块可以发送请求之外, urllib模块也可以实现请求的发送,只是操作方法略有不同! urllib在python中分为urllib和urllib2,在python3 阅读全文
posted @ 2025-05-10 08:04 生而自由爱而无畏 阅读(173) 评论(0) 推荐(0)
摘要: 一、web请求全过程剖析 我们浏览器在输入完网址到我们看到网页的整体内容, 这个过程中究竟发生了些什么? 我们看一下一个浏览器请求的全过程 接下来就是一个比较重要的事情了. 所有的数据都在页面源代码里么? 非也~ 这里要介绍一个新的概念 那就是页面渲染数据的过程, 我们常见的页面渲染过程有两种, 服 阅读全文
posted @ 2025-05-10 07:31 生而自由爱而无畏 阅读(18) 评论(0) 推荐(0)
摘要: 数据解析 本文章中, 介绍三种解析方式: re解析 (必修) bs4解析 xpath解析(必修) 以上三种方案都可以从HTML中提取到你需要的内容, 这三种方式可以混合进行使用, 完全以结果做导向, 只要能拿到你想要的数据. 用什么方案并不重要. 当你掌握了这些之后. 再考虑性能的问题. 一. re 阅读全文
posted @ 2025-05-10 07:09 生而自由爱而无畏 阅读(21) 评论(0) 推荐(0)