12 2021 档案

摘要:图片识别引擎 1 tesseract OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程。对于图形验证码来说,它们都是一些不规则的字符,这些字符确实是由字符稍加扭曲变换得到的内容。 tesseract下载地址1 阅读全文
posted @ 2021-12-28 14:18 三叶草body 阅读(400) 评论(0) 推荐(0)
摘要:请求响应数据提取 1 响应分类 1.1 结构化数据 1.1.1 json数据 josn格式数据出现比较高频,使用json,re,jsonpath等模块提取数据。 1.1.2 xml数据 xml是一种可扩展标识语言,功能更加专注于存储和传输数据。 xml格式数据低频出现,使用re, lxml等模块提取 阅读全文
posted @ 2021-12-25 15:03 三叶草body 阅读(157) 评论(0) 推荐(0)
摘要:win10配置python虚拟环境的路径 当我们在进行python项目开发的时候,为了不让项目间的python环境产生冲突,这是需要配置虚拟环境,从而使项目与项目之间的包相互隔离,互不影响。 1 安装 pip install virtualenvwrapper pip install virtual 阅读全文
posted @ 2021-12-25 11:35 三叶草body 阅读(359) 评论(0) 推荐(0)
摘要:flask-sqlalchemy总结 Flask-SQLAlchemy是一个Flask扩展,简化了在Flask程序中使用SQLAlchemy的操作。SQLAlchemy是一个很强大的关系型数据库框架,支持多种数据库后台。SQLAlchemy提供了高层ORM,也提供了使用数据库原生SQL的低层功能。 阅读全文
posted @ 2021-12-22 17:48 三叶草body 阅读(748) 评论(0) 推荐(0)
摘要:1 cookie cookie是存储在浏览器中的键值对文本信息。 由于HTTP是一种无状态的协议,服务器单从网络连接上无从知道客户身份。怎么办呢?就给客户端们颁发一个通行证吧,每人一个,无论谁访问都必须携带自己通行证。这样服务器就能从通行证上确认客户身份了。这就是Cookie的工作原理。 cooki 阅读全文
posted @ 2021-12-14 16:30 三叶草body 阅读(247) 评论(0) 推荐(0)