文章分类 - 爬虫
摘要:完整代码展示 import requests # 1.指定url main_url = 'https://www.eastmoney.com/' # 2.发起请求: response = requests.get(url=main_url) print(response.content) # 设置响
阅读全文
摘要:一、HTTP请求处理 1. requests库基础 import requests response = requests.post(url, data=payload) 网络请求库:第三方库requests简化HTTP请求操作 POST方法:向指定URL发送表单数据(form-data) 返回值处
阅读全文
摘要:一、数据解析核心技术 1.1 BS4解析详解 from bs4 import BeautifulSoup import requests # 创建解析对象 response = requests.get('https://example.com') soup = BeautifulSoup(resp
阅读全文
摘要:一、爬虫相关介绍 1.1 什么是爬虫? 爬虫(Web Crawler)是通过编写程序模拟浏览器行为,自动抓取互联网数据的核心技术。其核心原理分为两个关键点: 模拟浏览器行为:现代浏览器本质是天然爬虫工具,爬虫程序通过HTTP协议模拟浏览器请求 数据抓取策略: • 全量抓取:获取页面全部内容 • 精准
阅读全文
摘要:## 一、字符串操作的本质与特性 Python中的字符串是**不可变序列类型**,所有操作均返回新字符串。理解这一特性是高效使用字符串方法的关键: - **不可变性**:任何操作不会修改原字符串 - **链式调用**:可连续调用多个方法(如`s.upper().strip()`) - **方法分类*
阅读全文
摘要:一、字符串操作的本质:有序字符序列 字符串在Python中是一个不可变的字符序列,其底层实现基于字符数组。理解字符串的序列特性是掌握以下操作的关键: 索引定位:精准获取单个字符 切片截取:灵活提取子字符串 序列运算:实现拼接与重复 成员判断:快速检索内容 二、索引操作:精准定位字符 1. 索引规则图
阅读全文
摘要:一、字符串操作的重要性 字符串作为编程中最常用的数据类型,承担着: 用户输入输出处理(如登录注册) 文本数据处理(如日志分析) 文件路径操作(如自动化脚本) 本文将详解字符串长度计算、转义符妙用、格式化输出三大核心技能,附实用代码示例。 二、字符串长度计算:len()函数 基础用法速查 s = "h
阅读全文
摘要:一、前言:为什么运算符是编程的基石? 运算符是编程语言中操作数据的符号载体,相当于数学中的加减乘除符号。掌握运算符的灵活使用,能帮助我们实现: 数据计算(如游戏血条增减) 逻辑判断(如考试成绩判定) 流程控制(如循环条件设置) 本文将用5分钟带你掌握Python运算符的4大类核心用法,附游戏开发、成
阅读全文
摘要:一、项目背景与目标 需求:爬取某网站每个考试分类下的每日一练试题(含题目、选项、答案) 技术挑战: 需要处理动态参数(sign/subsign) 需要模拟登录维持Cookie 接口参数关联性解析 二、完整实现代码(带注释版) import requests from lxml import etre
阅读全文

浙公网安备 33010602011771号