摘要: 在uwsgi.ini文件中加入 enable-threads=true preload=true lazy-apps=true 阅读全文
posted @ 2020-07-29 23:50 少年依旧 阅读(982) 评论(0) 推荐(0) 编辑
摘要: 代理检测 目标:检测代理响应速度、稳定性、匿名度、是否在黑(白)名单 1、响应速度可以通过超时请求来过滤 2、匿名度 url = 'http://httpbin.org/get' 如何headers中有"Ngx-Client-Ip": "xxx.xxx.xxx.xxx"或者origin字段中有包含本 阅读全文
posted @ 2020-04-28 14:15 少年依旧 阅读(178) 评论(0) 推荐(0) 编辑
摘要: 一、execjs不支持eval函数的运行,需要更换eval为return 二、execjs的call必须调用函数,可以在需要调用的js外添加function run(){} 三、execjs调用的函数内部只能运行一个函数 阅读全文
posted @ 2020-04-28 14:14 少年依旧 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 踩过的坑 1、当查询的数据量超过表总量的1/3,则不会使用索引。 --> 使用索引查找一条数据需要执行3此磁盘IO,如果超过1/3则需要执行的磁盘IO总量将大于全表查询执行的磁盘IO总数。 2、使用group by查询时,如何正确的使用索引(参考group by优化) 3、联合索引使用时,第一位的索 阅读全文
posted @ 2020-04-28 13:51 少年依旧 阅读(228) 评论(0) 推荐(0) 编辑
摘要: 一、明确需求,通过excel表展示需求数据来核对双方理解是否一致,如下图。 注意:如果需求中有根据时间来拉取数据,一定要明确这个时间所指代的意义。 二、明确接口需要返回的数据结构以及数据字段,如果不清楚后面的业务逻辑具体需求就尽可能全面的返回有用的数据字段。 三、明确接口的安全级别,并发级别,并制定 阅读全文
posted @ 2020-04-28 13:48 少年依旧 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 问题记录 1、在for循环下创建线程,会一次性全部创建,消耗内存 import threading def test(): print('test') for i in range(1000); t = threading.Thread(target=test) # 此时已经新建了1000个线程对象 阅读全文
posted @ 2019-10-15 16:41 少年依旧 阅读(813) 评论(0) 推荐(0) 编辑
摘要: 一般默认安装最新的版本(目前是7.0.8),但是通过测试发现这个版本会报错(ImportError: MagickWand shared library not found.)所以建议安装 im6版本 im6的安装 前面没有需要注意的,到了这一步需要勾选第5个框 安装完成后需要配置系统环境变量 La 阅读全文
posted @ 2018-12-15 13:23 少年依旧 阅读(827) 评论(0) 推荐(0) 编辑
摘要: def chinese2digit(text): """"中文日期转换为数字日期""" # 注意:输入格式必须是 二〇一二年十月十一日 年份不能写 两千零一二 chinese_to_digit_table = {'零':0, 'O':0, 'Ο':0, 'О':0, '○':0, 'O': 0, ' 阅读全文
posted @ 2018-12-04 16:41 少年依旧 阅读(1134) 评论(0) 推荐(0) 编辑
摘要: ~(暂且叫他波浪号吧) 和 LIKE 和 ILIKE 操作符可以模糊匹配字符串,LIKE是一般用法,ILIKE匹配时则不区分字符串的大小写,~ 波浪号则可以使用正则匹配。 LIKE和 ILIKE 它们需要结合通配符使用,下面介绍两种常用的通配符。 %:百分号用于匹配字符串序列,可匹配任意组合; _: 阅读全文
posted @ 2018-11-18 17:17 少年依旧 阅读(5866) 评论(0) 推荐(0) 编辑
摘要: 参考地址:https://github.com/jsvine/pdfplumber 简单的pdf转换文本: import pdfplumber with pdfplumber.open(path) as pdf: for page in pdf.pages: content = page.extra 阅读全文
posted @ 2018-11-16 15:22 少年依旧 阅读(5478) 评论(0) 推荐(0) 编辑