07 2022 档案

摘要:Python 的特殊文件操作 ini文件是Initialization File的缩写,平时用于存储软件的的配置文件。例如:MySQL数据库的配置文件。 1.ini 文件 #代表注释,[]代表节点,下面的的所有代表键值。 [mysqld] # 节点 # 键= 值 datadir=/var/lib/m 阅读全文
posted @ 2022-07-27 21:39 紫青宝剑 阅读(193) 评论(0) 推荐(0)
摘要:flask 源码梗概 flask 中的线程主要基于LocalStack进行使用,在global中维护这个类的两个对象。 # context locals _request_ctx_stack = LocalStack() # 请求上下文:主要有 request 和 session 两个对象 _app 阅读全文
posted @ 2022-07-26 19:53 紫青宝剑 阅读(134) 评论(0) 推荐(0)
摘要:高性能异步爬虫 说明:本文章只用于学习交流,严禁用于其他途径,如有不妥,可立即下架。 目的:在爬虫中使用异步实现高性能的数据爬取操作。异步发送请求,网络请求属于IO操作,一般使用线程异步或者协程异步。 参考文章:https://www.cnblogs.com/Blogwj123/p/15893616 阅读全文
posted @ 2022-07-24 14:31 紫青宝剑 阅读(110) 评论(0) 推荐(0)
摘要:3.Flask 中的线程 3.1 知识补充 3.1.1 线程补充 from threading import Thread import time class Foo(): def __init__(self): self.num = 0 val = Foo() def task(i): val.n 阅读全文
posted @ 2022-07-21 20:09 紫青宝剑 阅读(279) 评论(0) 推荐(0)
摘要:2.启动函数返回值的剖析 本次剖析根据 flask 内部的处理流程将返回值推导出。 2.1 源码剖析 from werkzeug import run_simple def func(environ,start_response): # 该函数必须要加上参数:environ,和start_respo 阅读全文
posted @ 2022-07-21 20:05 紫青宝剑 阅读(747) 评论(0) 推荐(0)
摘要:Flask 源码剖析 flask 是一个基于 Python 开发的 wsgi 微型框架。flask 有两个核心依赖库:Werkzug和jinjia。其中werkzeug 负责核心的逻辑模块,比如路由、请求和应答的封装、WSGI 相关的函数等;jinja负责模板的渲染,主要用来渲染返回给用户的 htm 阅读全文
posted @ 2022-07-20 20:55 紫青宝剑 阅读(155) 评论(0) 推荐(0)
摘要:异步编程&协程 为什么学习协程: 异步相关话题和框架越来越多,例如:tornado、fastapi、django 3.x asgi 、aiohttp都在异步 -> 提升性能。 1.协程 协程不是计算机提供的,是程序员人为创造的。 协程(Coroutine),也被称之为微线程,是一种用户态内的上下文切 阅读全文
posted @ 2022-07-16 23:02 紫青宝剑 阅读(237) 评论(0) 推荐(0)
摘要:Flask蓝图 概述:蓝图分为两种方式,按照功能划分,与按照结构划分。 1.小蓝图 说明:按照功能划分蓝图。 在视图函数中创建多个 py 文件,每个 py 文件中的视图函数都可以注册到蓝图中; 目录结构如图所示: manage.py 为启动文件: # -*- coding: utf-8 -*- fr 阅读全文
posted @ 2022-07-13 23:21 紫青宝剑 阅读(486) 评论(0) 推荐(0)
摘要:Flask框架基本使用 1.环境准备 pip install flask Flask Flask库文件 Jinja2 模板渲染库 MarkupSafe 返回安全标签 只要Flask 返回模板或者标签时都会依赖MarkupSafe Werkzeug 德文“工具” == uWSGI 底层是 WSGI F 阅读全文
posted @ 2022-07-12 22:51 紫青宝剑 阅读(363) 评论(0) 推荐(0)
摘要:模拟登录 概述:通过requests模块模拟使用浏览器登录网站的行为。 1.模拟登录原理 概述:模拟登录,一般是网站在浏览器中使用POST请求向后端发送数据请求的过程,响应后的数据一般会设置相关的Session与Cookie标识用户的登录标识。对于前后端分离的项目中,也有可能是加密密钥的token, 阅读全文
posted @ 2022-07-04 15:15 紫青宝剑 阅读(317) 评论(0) 推荐(0)
摘要:验证码的识别 验证码和爬虫之间的爱恨情仇? 反爬机制:验证码.识别验证码图片中的数据,用于模拟登陆操作。 识别验证码的操作: 人工肉眼识别。(不推荐) 第三方自动识别(推荐) 可以使用机器学习算法或者gitee上的一些开源项目进行识别,但是效果比较单一。 1.云打码的使用 说明:云打码平台多种多样, 阅读全文
posted @ 2022-07-01 09:19 紫青宝剑 阅读(1094) 评论(0) 推荐(0)
摘要:requests 模块的使用与数据解析的介绍 提前补充:Python 中常用的发送网络信息就是requests和urllib模块。 1.介绍 requests模块:python中一款基于网络请求的模块,功能非常强大,简单便捷,效率极高。 作用:模拟浏览器发请求。 如何使用:(requests模块的编 阅读全文
posted @ 2022-07-01 09:17 紫青宝剑 阅读(397) 评论(0) 推荐(0)
摘要:Python 数据采集的介绍 1.爬虫是什么 概念:通过编写程序,模拟浏览器上网,然后让其去互联网上抓取数据的过程。 2.爬虫的合法性 2.1 风险 爬虫干扰了被访问网站的正常运营 抓取了受到法律保护的特定类型的数据信息 2.2 使用 优化程序,避免干扰被访问网站的正常运行。 使用,或传播抓取到的数 阅读全文
posted @ 2022-07-01 09:16 紫青宝剑 阅读(497) 评论(0) 推荐(0)