摘要: 4.3 字典 (dictionary) 4.3.1 认识字典 什么是字典 由一组键 (key)与之对应的值(value)所构成,键与值之间用冒号分隔,键与值之间的关系一一对应。键的作用相当于索引。 特点: 可变序列,以 key-value 存储,key 不能重复 元素无序 因为字典的存放过程会经过哈 阅读全文
posted @ 2022-01-12 23:03 你是我的生命之源 阅读(211) 评论(0) 推荐(0)
摘要: 4.1 列表 (list) 4.1.1 认识列表 为什么需要列表 为了更方便对多个数据进行整体操作 列表相当于其他语言中的数组 存储原理: 列表存储的是对象的“引用“,而非对象本身 内存示意图 4.1.2 列表的特点 有序 索引映射唯一数据 可以储存重复、任意类型数据 根据动态分配和回收内存 4.1 阅读全文
posted @ 2022-01-12 22:58 你是我的生命之源 阅读(233) 评论(0) 推荐(0)
摘要: 第二章流程控制结构 流程控制结构包括顺序结构、选择结构、循环结构 2.1 顺序结构 2.1.1 赋值语句 简单赋值语句 变量=表达式 复合赋值语句 变量op=表达式 op 可以是一个位运算符或者算术运算符,它与赋值运算符=一起构成符合赋值运算符。 多变量赋值语句 链式赋值语句 链式一般语法格式: 变 阅读全文
posted @ 2022-01-12 14:07 你是我的生命之源 阅读(175) 评论(0) 推荐(0)
摘要: scrapy 入门 scrapy 框架创建步骤 创建一个 scrapy 项目 scrapy startproject <project_name> 生成一个爬虫 scrapy genspider <name> <domain> 提取数据 完善 spider ,通过 xpath 等方法 保存数据 pi 阅读全文
posted @ 2021-12-24 18:07 你是我的生命之源 阅读(203) 评论(0) 推荐(0)
摘要: Scrapy 框架介绍 Scrapy 将爬虫的三步:获取网页、解析网页、数据存储都整合的应用框架 应用框架指的是实现了某应用领域通用完备功能(除去特殊应用的部分)的底层服务 Scrapy 框架主要由五大组件组成: Scrapy 引擎(Scrapy Engine): Scrapy 引擎是整个框架的核心 阅读全文
posted @ 2021-12-24 17:54 你是我的生命之源 阅读(534) 评论(0) 推荐(0)
摘要: python 连接和操作 mysql 数据库 1 下载安装 pymysql 库 pip install pymysql 2 导入 pymysql 库 import pymysql 3 连接 Mysql 数据库 语法:pymysql.counect(host, user, password, db, 阅读全文
posted @ 2021-12-16 09:07 你是我的生命之源 阅读(358) 评论(0) 推荐(0)
摘要: 1基础语法 1.1 公式环境 行内环境:单 $ 示例:$1\times1=1$ 单独一行居中环境:双 $$ 示例: $$ 1\times1=1 $$ 1.2 角标 | 角标类型 | 语法 | 示例 | | : : | : : | : : | | 上标 | ^ | $2^5$ | | 下标 | _ | 阅读全文
posted @ 2021-11-27 10:45 你是我的生命之源 阅读(1679) 评论(0) 推荐(1)
摘要: 1 Fiddler抓包 在我看来Fiddler的对于python爬虫的最大意义就是抓包,当然FIddler不止这一个意义,只是我没说,不代表没有。 1.1 fiddler简介 位于客户端和服务器之间的HTTP代理 Fiddler为什么可以作为一个代理,是如何实现的?(这就是Fidder的原理) 在浏 阅读全文
posted @ 2021-11-27 10:43 你是我的生命之源 阅读(741) 评论(0) 推荐(0)
摘要: 使用lxml解析网页和自动化测试 1 使用lxml解析网页 lxml库结合libxml2快速强大的特性,使用xpath语法来进行文件格式解析,与Beautiful相比,效率更高 1.1 XPath XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的 阅读全文
posted @ 2021-11-20 12:05 你是我的生命之源 阅读(632) 评论(0) 推荐(0)
摘要: 基于爬取的数据进行分析-生成统计词云 本篇是通过生成词云来介绍相关库及相关知识,不讲解生成词云的具体操作 生成词云步骤: 1 分词处理--Jieba库 Jieba是一个用于中文分词处理的第三方库 Jieba分词的原理 利用中文词库,确定汉字之间的关联概率 汉字间概率大的组成词组,形成分词结果 除了分 阅读全文
posted @ 2021-11-20 11:49 你是我的生命之源 阅读(518) 评论(0) 推荐(0)
页脚