随笔分类 -  Python

Python相关笔记
摘要:概念 基于numpy tensor张量,实现GPU加速 API import torch 元素操作 torch.empty(5, 3) 5行3列 数据是内存里的脏数据 torch.rand(5, 3) 5行3列 数据是范围在[0, 1)均匀分布的数据 torch.randn(5, 3) 随机值,数据 阅读全文
posted @ 2024-12-10 22:53 liDB 阅读(19) 评论(0) 推荐(0)
摘要:数据集 sklearn.datasets from sklearn.datasets import load_iris, fetch_20newsgroups 小数据集下载 load_xxx 大数据集下载 fetch_xxx 模型 KNN K-近邻算法 参考 距离计算 k值选择 kd树 维度:选择( 阅读全文
posted @ 2024-11-16 22:49 liDB 阅读(51) 评论(0) 推荐(0)
摘要:原文:https://www.cnblogs.com/sunShineJing/p/14340976.html 安装python环境 pip安装sphinx,sphinx_rtd_theme 然后cd 到docs的上一级目录 执行命令 sphinx-build -b html docs build 阅读全文
posted @ 2024-02-21 20:27 liDB 阅读(30) 评论(0) 推荐(0)
摘要:调试工具 winpdb-reborn 利用可视化工具进行调试,依赖wxPython pdb python内置的一个交互式调试模块 rpdb 远程调试代码 测试工具 unittest python内置的单元测试模块 nose 阅读全文
posted @ 2022-03-13 22:04 liDB 阅读(58) 评论(0) 推荐(0)
摘要:socket模块 实现客户端 - 服务器应用 celery库 分布式任务管理 pyro4 实现远程方法调用(RMI) 阅读全文
posted @ 2022-03-13 16:49 liDB 阅读(79) 评论(0) 推荐(0)
摘要:python 并行编程 异步模型 asynchronous model 在并发异步执行模型中,不同任务的执行在时间轴上有交叠,所有活动都在单一控制流作用下完成(单线程)。一旦启动,任务的执行可以暂挂,过一段时间后再恢复,与当前其他任务的执行交替进行。 concurrent.futures 模块 co 阅读全文
posted @ 2022-03-12 18:02 liDB 阅读(385) 评论(0) 推荐(0)
摘要:python 并行编程 multiprocessing 进程 multiprocessing.Process 类 init(group=None, target=None, name=None, args=(), kwargs={}) 参数 group: 进程组,必须为None,为将来的实现保留的 阅读全文
posted @ 2022-03-12 14:46 liDB 阅读(221) 评论(0) 推荐(0)
摘要:Python内置函数 sorted() 参数 args iterable:可迭代数据 kwargs cmp: 排序函数(目前还没有用到过 😃 key: 键函数,iterable中每一个元素经过key函数得到一个值,最终是根据这个值进行排序 reverse: 是否逆序(从大到小),默认为False, 阅读全文
posted @ 2022-03-03 23:21 liDB 阅读(37) 评论(0) 推荐(0)
摘要:compile() 参数 string: 正则表达式字符串 flag: 匹配模式,多个值可以使用按位或运算符| 表示同时生效 re.I: 忽略大小写 re.M: 多行模式,改变^和$的行为 re.S: 点任意匹配模式,改变.的行为 re.L: 使预定字符类\w \W \b \B \s \S 取决于当 阅读全文
posted @ 2022-03-03 22:28 liDB 阅读(169) 评论(0) 推荐(0)
摘要:python 并行编程 threading 线程 线程由3个元素组成:程序计数器、寄存器和堆栈。 同一个进程内的多个线程可以共享当前进程资源包括:数据和操作系统资源。 线程有自己的状态: 就绪(ready)、运行(running)、阻塞(blocked)。 创建线程 --> 就绪 就绪 --> 操作 阅读全文
posted @ 2022-03-02 16:41 liDB 阅读(422) 评论(0) 推荐(0)
摘要:beautifulsoup4 引用:from bs4 import BeautifulSoup BeautifulSoup 类 soup = BeautifulSoup(),此类会在初始化时自动修正html 获取节点 soup.节点名,比如soup.p获取节点,会返回第一个匹配到的p节点,返回类型是 阅读全文
posted @ 2022-02-27 17:53 liDB 阅读(105) 评论(0) 推荐(0)
摘要:urllib request 最基本的http请求模块 build_opener 函数 使用一些默认的handler构建一个opener(OpenerDirector类型) urlopen 函数 最基本的构造HTTP请求的方法,实际这个函数内部就是使用build_opener完成创建opener,然 阅读全文
posted @ 2022-02-27 11:13 liDB 阅读(60) 评论(0) 推荐(0)
摘要:scrapy spider 爬虫,负责生成Request以及对爬取结果解析并生成对应的Item spider middleware 爬虫中间件,位于engine和spider之间,可以对响应和Item进行处理 engine 引擎,负责处理整个系统的数据流和事件 schelduler 调度器,负责维护 阅读全文
posted @ 2022-02-12 11:04 liDB 阅读(84) 评论(0) 推荐(0)
摘要:git add 之后,git status 把添加的文件通过正则替换后,复制到files = [xxx]中 比如: modified: crawler/main.py modified: crawler/download.py 替换为 'crawler/main.py', 'crawler/down 阅读全文
posted @ 2022-02-09 18:01 liDB 阅读(63) 评论(0) 推荐(0)
摘要:用作布尔表达式(如用作if语句中的条件)时,下面的值都将被解释器视为假: False None 0 "" () [] {} 也就是说, 标准值False和None、 各种类型(包括浮点数、复数等)的数值0、 空序列(如空字符串、空元组和空列表)、 空映射(如空字典)都被视为假, 而其他各种值都被视为 阅读全文
posted @ 2022-02-09 15:45 liDB 阅读(189) 评论(0) 推荐(0)
摘要:序列sequence 通用的序列操作 索引 索引从0开始 最后一个元素的索引可以用-1表示 字面量后面可直接执行索引操作,而不必先把字面量赋值给一个变量 切片 [起始索引:结束索引:步长] 三个值都可以省略 省略起始索引,表示从第一个元素开始 省略结束索引,表示一直到列表最后,包括最后一个元素 省略 阅读全文
posted @ 2022-01-21 11:36 liDB 阅读(75) 评论(0) 推荐(0)
摘要:一点点关于数字、字符串、字节的小知识 def main(): print('整数除法 5 / 3 =', 5 / 3) print('整数整除 5 // 3 =', 5 // 3) print('整数取余 5 % 3 =', 5 % 3) print('浮点数除法 5.0 / 3.0 =', 5.0 阅读全文
posted @ 2022-01-20 15:40 liDB 阅读(92) 评论(0) 推荐(0)
摘要:seleniu 一点常用的操作 import random import time from datetime import datetime from selenium import webdriver from selenium.webdriver.common.by import By fro 阅读全文
posted @ 2022-01-19 09:07 liDB 阅读(53) 评论(0) 推荐(0)
摘要:lxml 一点常用的操作 from lxml import etree def get_all_child_node_text(): txt = """ <div class="content" id='id_' name='name_'> <p>输入只有一行半径r.</p> </div> <div 阅读全文
posted @ 2022-01-19 09:04 liDB 阅读(65) 评论(0) 推荐(0)
摘要:模块 pywinauto https://www.kancloud.cn/gnefnuy/pywinauto_doc/1193035 https://pywinauto.readthedocs.io/en/latest/contents.html API pyautogui https://blog 阅读全文
posted @ 2022-01-18 11:10 liDB 阅读(49) 评论(0) 推荐(0)