随笔分类 -  python基础

python的基础操作
jupyter notebook快速启动的方法
摘要:在目录下建立一个bat文件 cd %cd% jupyter notebook 保存以后,今后双击运行即可 阅读全文

posted @ 2023-04-21 10:41 耀扬 阅读(199) 评论(0) 推荐(0)

Python中tqdm模块进度条
摘要:tqdm模块简单介绍 tqdm是一个可以显示Python进度条的模块,可通过pip在终端安装 pip install tqdm tqdm.tqdm from tqdm import tqdm for i in tqdm(range(1, 5)): print(i) 或传入字符串list: from 阅读全文

posted @ 2023-04-12 11:16 耀扬 阅读(105) 评论(0) 推荐(0)

python把mp4转mp3
摘要:预先下载 Pip install moviepy from moviepy.editor import * def outputmp3(input_path, output_path): listdir = os.listdir(input_path) # 获得路径所有文件名 mp4namelist 阅读全文

posted @ 2023-04-04 10:38 耀扬 阅读(488) 评论(0) 推荐(0)

python-httpx 发送http2.0时代请求
摘要:原文,自己做个笔记用 https://blog.51cto.com/u_15127674/3872190 官方文档的地址 https://www.python-httpx.org/ 我们在日常开发中,经常会发送各种各样的网络请求。Python中常用的网络请求库有requests、aiohttp、ht 阅读全文

posted @ 2023-03-04 20:42 耀扬 阅读(1961) 评论(0) 推荐(0)

base64图片保存
摘要:讲base64编码的图片,保存为png from io import BytesIO from PIL import Image import base64 def base64_to_image(base64_str): # 输入为base64格式字符串,输出为PIL格式图片 byte_data 阅读全文

posted @ 2022-09-28 10:49 耀扬 阅读(192) 评论(0) 推荐(0)

pillow图片打字水印 The _imagingft C module is not installed
摘要:如果如下安装出现问题 pip install pillow 说明c的编译有问题,直接去这里下载 whl 文件 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 然后 pip install ***.whl 最好重启一下,就可以解决了 from PIL import 阅读全文

posted @ 2022-09-28 10:48 耀扬 阅读(69) 评论(0) 推荐(0)

python提取pdf文字包括直接解析和ocr两种方式
摘要:1、可以直接提取的pdf from io import StringIO from io import open from pdfminer.converter import TextConverter from pdfminer.layout import LAParams from pdfmin 阅读全文

posted @ 2022-07-19 15:35 耀扬 阅读(3031) 评论(0) 推荐(0)

'Document' object has no attribute 'pageCount',_writeIMG() missing 1 required positional argument: 'format'问题
摘要:python中想用fitz库,把pdf转为图片。 网上找了资料发现。均报错 'Document' object has no attribute 'pageCount' 没啥 肯定是库升级了,函数改名了。 首先 考虑 使用 dir() 方法查找一下该对象的所有的属性和方法 果然改名了 # 安装fit 阅读全文

posted @ 2022-07-18 16:55 耀扬 阅读(7499) 评论(0) 推荐(0)

centos安装anaconda教程
摘要:1.更新yum 命令: sudo yum update 2、安装anaconda 2.1 查看anaconda对应python版本 我选的3.8版 https://docs.anaconda.com/anaconda/packages/oldpkglists/ 2.2 进入 清华镜像 https:/ 阅读全文

posted @ 2022-06-08 12:40 耀扬 阅读(1747) 评论(0) 推荐(0)

python操作CSV
摘要:使用csv.reader读取数据 import csv # 以读方式打开文件 with open("data.csv", mode="r", encoding="utf-8-sig") as f: # 基于打开的文件,创建csv.reader实例 reader = csv.reader(f) # 获 阅读全文

posted @ 2022-06-04 11:51 耀扬 阅读(312) 评论(0) 推荐(0)

networkx无法显示中文
摘要:修改matplotlibrc文件 font.family : sans-serif #打开该选项 #打开该选项 font.sans-serif : Microsoft YaHei , Bitstream Vera Sans, Lucida Grande, Verdana, Geneva, Lucid 阅读全文

posted @ 2022-06-03 23:24 耀扬 阅读(470) 评论(0) 推荐(0)

jupyter Notebook 三方库常用功能
摘要:以下操作直接在notebook里面写 即可 1、查看库版本 numpy.__version__ 2、如果看到 no module 直接 pip install numpy 3、升级三方库 pip install numpy --upgrade 阅读全文

posted @ 2022-06-01 12:10 耀扬 阅读(369) 评论(0) 推荐(0)

pyLDAvis图表无法打开
摘要:利用pyLDAvis研究LDA模型。 遇到了两个问题 1、代码老旧,代码如下: 提示错误,这是pyLDAvis版本升级导致的。 No module named ‘pyLDAvis.gensim’ 改成如下: import pyLDAvis.gensim_models pyLDAvis.enable_ 阅读全文

posted @ 2022-05-31 20:38 耀扬 阅读(878) 评论(0) 推荐(0)

飞浆paddleocr识别
摘要:1 安装 PaddlePaddle 有显卡的: python3 -m pip install paddlepaddle-gpu 没显卡的: python3 -m pip install paddlepaddle 1.2 安装PaddleOCR Whl包 pip install paddleocr 调 阅读全文

posted @ 2022-05-20 16:15 耀扬 阅读(605) 评论(0) 推荐(0)

python第三方库AC自动机pyahocorasick的使用
摘要:pyahocorasick是一个快速且内存效率高的库,用于精确或近似多模式字符串搜索,这意味着您可以在某些输入文本中一次找到多个关键字符串出现。 字符串“索引”可以提前构建并保存到磁盘以便稍后重新发送。 pyahocorasick是用 C 语言实现的,并在 Python 3.6 及更高版本上进行了测 阅读全文

posted @ 2022-04-26 20:50 耀扬 阅读(7353) 评论(0) 推荐(0)

pip常用命令
摘要:命令:python 库的setup.py install 1.查看pip (1)直接在cmd窗口中输入pip命令,会显示pip所有的参数使用方法; (2)输入pip提示Did not provide a command,则有两种可能,第一是没有配置环境变量,第二就是其他应用程序也存在pip的环境变量 阅读全文

posted @ 2022-04-16 15:17 耀扬 阅读(1049) 评论(0) 推荐(0)

python交集并集差集对称差集
摘要:a=set([1,2,3,4]) b=set([3,4,5,6]) #并集 a|b {3, 4} #交集 a&b {1, 2, 3, 4, 5, 6} #差集 a-b {1, 2} #对称差集 a^b {1, 2, 5, 6} 阅读全文

posted @ 2021-10-15 16:08 耀扬 阅读(209) 评论(0) 推荐(0)

python实现二维数组复制
摘要:h=[[1,2],[2,3]] v=[[x for x in y] for y in h] v[0][0]=2 v [[2, 2], [2, 3]] 阅读全文

posted @ 2021-09-17 17:00 耀扬 阅读(595) 评论(0) 推荐(0)

python正则表达式过滤
摘要:strr=r'045-夜总.....夜(6人封闭).zip.zip' re.sub(r'\d+-|(.zip)|[(](.*?)[)]', "",strr) 输出结果 夜总.....夜 阅读全文

posted @ 2021-08-12 17:50 耀扬 阅读(365) 评论(0) 推荐(0)

将爬取网页中的相对路径转换为绝对路径
摘要:##1.背景: 在爬取网页中的过程中,我对目前爬虫项目后端脚本中拼接得到绝对路径的方法很不满意,今天很无意了解到在python3 的 urllib.parse模块对这个问题有着非常完善的解决策略,真的是上天有眼,感动! ##2.urllib.parse模块 This module defines a 阅读全文

posted @ 2021-02-18 16:15 耀扬 阅读(716) 评论(0) 推荐(0)

导航