摘要: CuPy是NumPy的GPU加速版本 CuPy 概览 今天我们来聊聊一个在 Python 数据科学领域中日益受到关注的库——CuPy。 什么是 CuPy? CuPy 是一个开源的 Python 库,它的设计初衷是为了使得在 GPU 上的计算变得简单快捷。 它提供了与 NumPy 非常相似的 API, 阅读全文
posted @ 2024-05-09 14:41 larkwins 阅读(1188) 评论(1) 推荐(2)
摘要: 您是否有时觉得在处理表格数据时感到不知所措? 也许你在处理一个大型 CSV 文件,遇到了各种数据不一致的问题,或者需要验证数据,确保其准确无误才能进行下一步分析。 传统的数据分析库或许功能强大,但学习曲线陡峭,用起来有点杀鸡用牛刀的感觉。 这时,有一个更适合此类任务的工具——那就是 Agate。 A 阅读全文
posted @ 2024-05-09 14:41 larkwins 阅读(130) 评论(0) 推荐(0)
摘要: 处理简单的少量数据,对速度是无感的,但如果要处理大量数据,哪怕每次几十毫秒的差异,最终也会差异巨大。 比如,你要为客户清洗一遍企业系统数据中,一堆之前留下的庞大的 JSON 文件。如果你打算用 Python 自带的 JSON 模块,那就调整好心态,备足咖啡,享受煎熬吧。 但如果有人告诉你,有比 Py 阅读全文
posted @ 2024-05-09 14:41 larkwins 阅读(235) 评论(0) 推荐(0)
摘要: Python Pony ORM 是一个功能强大且易于使用的 ORM 库,它提供了简洁的语法和强大的功能,使得开发者能够更轻松地进行数据库操作。 Python Pony ORM 的主要特点包括: 简单易用:Python Pony ORM 提供了简单易懂的语法,使得开发者可以快速上手并进行数据库操作。 阅读全文
posted @ 2024-05-09 14:40 larkwins 阅读(384) 评论(0) 推荐(0)
摘要: 简介 FastUI是一种全新的构建Web应用程序用户界面的方式,它是由声明式的Python代码定义的。它旨在为Python开发人员和前端开发人员提供一种简单而强大的工具,以便他们能够更高效地构建响应式的Web应用程序界面,而无需处理繁杂的JavaScript代码或底层的技术细节。 FastUI的优势 阅读全文
posted @ 2024-05-09 14:40 larkwins 阅读(763) 评论(0) 推荐(0)
摘要: 在我们的日常工作中,特别是数据分析、地理信息系统 (GIS) 开发,或者在线零售等行业中,经常会遇到处理包含地址信息的文本数据这个棘手的任务。 面对大量规格不统一,格式不一致的非结构化地址数据,想要从中快速地提取分级地址、联系人、电话等,简直就是不可能完成的任务。 即使费九牛二虎之力写一个处理程序, 阅读全文
posted @ 2024-05-09 14:40 larkwins 阅读(387) 评论(0) 推荐(0)
摘要: Github地址:https://github.com/pybuilder/pybuilder 在Python项目开发中,良好的构建和自动化流程是非常重要的。PyBuilder是一个用于构建Python项目的工具,它提供了简单易用的方式来定义和管理项目的构建过程,包括依赖管理、测试、代码质量检查等。 阅读全文
posted @ 2024-05-09 14:40 larkwins 阅读(222) 评论(0) 推荐(0)
摘要: Github:https://github.com/abhiTronix/vidgear 在当今数字化的时代,视频处理应用变得越来越普遍。无论是视频流分析、实时视频处理还是视频流转码,都需要强大的工具来实现。Python Vidgear 库就是这样一个工具,它为开发人员提供了丰富的功能,用于处理实时 阅读全文
posted @ 2024-05-09 14:40 larkwins 阅读(279) 评论(0) 推荐(0)
摘要: Github地址:https://github.com/reorx/httpstat HTTP(Hypertext Transfer Protocol)是互联网上应用最广泛的协议之一,用于在客户端和服务器之间传输数据。在开发和维护Web应用程序时,了解HTTP请求和响应的性能和状态信息非常重要。Py 阅读全文
posted @ 2024-05-09 14:40 larkwins 阅读(174) 评论(0) 推荐(0)
摘要: Github地址:https://github.com/jmcarpenter2/swifter 在数据科学和数据分析领域,Pandas 是一个非常强大的 Python 库,用于数据操作和数据清洗。然而,当处理大规模数据集时,Pandas 可能会变得相对较慢。这就是 Python Swifter 出 阅读全文
posted @ 2024-05-09 14:40 larkwins 阅读(665) 评论(0) 推荐(0)
摘要: 我们可能很少遇到需要判断图片类型的情况,因为通过扩展名一下子就判断出来了,但是从网上大量的下载图片,将它们作为机器学习的材料时,可能会遇到大量的图片只有数据没有扩展名的情况,为了将图片信息标准化,你就需要确定每一张图片数据的类型,到底是 jpg、png 还是 bmp 呢? 遇到这种状况,该怎么办呢? 阅读全文
posted @ 2024-05-09 14:40 larkwins 阅读(119) 评论(0) 推荐(0)
摘要: pdoc 是一个轻量级的库,专注于为 Python 项目生成 API 文档。 它通过扫描指定的模块和包,自动提取文档字符串,快速转化为易于浏览的 HTML 文档。这项技术尤其适用于需要快速生成文档的现代 Python 项目。 与市面上其他文档生成库例如 Sphinx 相比,pdoc 的特色在于其轻量 阅读全文
posted @ 2024-05-09 14:40 larkwins 阅读(268) 评论(0) 推荐(0)
摘要: 00 — Loguru 库介绍 在编程世界里,日志记录是一项基础而重要的任务,它帮助我们理解软件的运行状态,监控问题,并进行故障排查。 然而,Python 的标准日志模块虽然功能强大,但对于初学者来说,配置过程可能既复杂又繁琐。 今天,我要介绍的是一个名为 Loguru 的 Python 库,它以简 阅读全文
posted @ 2024-05-09 14:40 larkwins 阅读(300) 评论(0) 推荐(0)
摘要: Github地址:https://github.com/xlwings/xlwings 在现代数据分析和报表生成中,Microsoft Excel仍然是一款非常流行和强大的工具。与此同时,Python作为一种高级编程语言,具备出色的数据处理和分析能力。那么,有没有一种方法可以将Excel和Pytho 阅读全文
posted @ 2024-05-09 14:39 larkwins 阅读(547) 评论(0) 推荐(0)
摘要: 项目简介 文本隐水印,用来把一段信息嵌入到一段明文中,使信息隐密不可见,并且旁人无法察觉到嵌入后明文的变化。 经测试,在这些场景下信息隐藏比较完美 MacBook 版本的 Chrome 浏览器,包括知乎网页版、微博网页版等。 微信、钉钉。Mac/Iphone 版均可 苹果备忘录 用 Chrome 打 阅读全文
posted @ 2024-05-09 14:39 larkwins 阅读(237) 评论(0) 推荐(0)
摘要: 项目简介 它是一个强大的多语言(97种语言)的混合文本自动分词工具。[中日英韩:已测试] 主要用途:它非常适合各种 TTS 语音合成项目,多语种混合文本的前端推理,和预处理后端训练。 它基于 py3langid 的扩展实现(>=python3.6)。 LangSegment It is a mult 阅读全文
posted @ 2024-05-09 14:39 larkwins 阅读(914) 评论(0) 推荐(0)
摘要: 工作与学习中,有个场景需要判断指定日期是不是工作日,例如自动化办公工作日自动发邮件,量化交易判断是否为交易日等等, 因此我们需要能准确判断给的日期是不是工作日,Python中一般使用模块chinesecalendar来解决这个问题。 网友自己维护 from datetime import datet 阅读全文
posted @ 2024-05-09 14:39 larkwins 阅读(188) 评论(0) 推荐(0)
摘要: 在之前开发windows应用程序时,为了实现一个注册码只能注册一台设备(只要不换机器一台电脑的设备序列号是唯一的),这时需要获取使用者电脑硬件的各种常见信息,如主板信息,cpu信息等,经过查询,模块vmi可以实现我的需求。 vim简介 WMI是一项核心的Windows管理技术,WMI作为一种规范和基 阅读全文
posted @ 2024-05-09 14:39 larkwins 阅读(154) 评论(0) 推荐(0)
摘要: https://github.com/ztane/python-Levenshtein/ 在处理文本数据时,我们经常需要比较两个字符串的相似度,无论是在自然语言处理、数据清洗还是用户输入验证中。这时,Levenshtein距离(又称编辑距离)就显得尤为重要。它衡量的是,将一个字符串转换成另一个字符串 阅读全文
posted @ 2024-05-09 14:39 larkwins 阅读(368) 评论(0) 推荐(0)
摘要: petl 是个啥? 如果你正在寻找一种简洁方便的方法来处理数据,那么 petl(Python ETL)值得你关注。 它的设计哲学就是简单易用,无论你是需要从 CSV 提取数据,还是想将 JSON 数据转换为表格形式,或者是对数据进行排序、过滤及聚合操作,petl都能够轻轻松松帮你搞定。 当然,市面上 阅读全文
posted @ 2024-05-09 14:39 larkwins 阅读(173) 评论(0) 推荐(0)
摘要: 你是否曾面对过这样的情形: 打开一个文本文件,只为发现里面全是奇怪的字符,比如"文档"代替了"文档",或许这是某种神秘的外星文字? 然而,现实往往是这个文件的编码发生了错误,而你并不知道如何去修复它们。 就像生活中遇到各种意外情况一样,幸好有一个名叫 FTFY 的 Python 类库,像超级 阅读全文
posted @ 2024-05-09 14:39 larkwins 阅读(184) 评论(0) 推荐(0)
摘要: Pottery 是基于 Redis 的高级键值存储解决方案,提供了一系列简单易用的 API 来操作 Redis 数据库。这个库特别适合需要快速开发分布式应用或需要利用 Redis 强大功能的开发者。它简化了许多复杂的操作,使得开发者可以更加专注于业务逻辑的实现。 图源网络 特点 易用性: 提供了高级 阅读全文
posted @ 2024-05-09 14:39 larkwins 阅读(107) 评论(0) 推荐(0)
摘要: # Whoosh 简介 Whoosh 由 Matt Chaput 创建,它一开始是一个为 Houdini 3D 动画软件包的在线文档提供简单、快速的搜索服务工具,之后便慢慢成为一个成熟的搜索解决工具并已开源。 Whoosh 纯由 Python 编写而成,是一个灵活的,方便的,轻量级的搜索引擎工具,现 阅读全文
posted @ 2024-05-09 14:39 larkwins 阅读(160) 评论(0) 推荐(0)
摘要: Github地址:https://github.com/elliotgao2/toapi Python Toapi 是一个基于 XPath 和 CSS 选择器的 Web API 框架,它能够快速将网页内容转换为结构化的 API。Toapi 提供了简单易用的接口,使得开发者可以轻松地从网页中提取数据, 阅读全文
posted @ 2024-05-09 14:38 larkwins 阅读(657) 评论(0) 推荐(0)
摘要: Github地址:https://github.com/thumbor/thumbor Thumbor 是一个功能强大的 Python 图片处理库,可以用于生成、裁剪、缩放、旋转和优化图像,同时还提供了安全性和缓存等功能。本文将详细介绍 Thumbor 库的特性、用法,并通过丰富的示例代码展示其在实 阅读全文
posted @ 2024-05-09 14:38 larkwins 阅读(319) 评论(0) 推荐(0)
摘要: "xpinyin" 是一个 Python 库,用于将汉字转换为拼音。通过 xpinyin 库,你可以在 Python 中实现将中文字符转换为拼音的功能,方便在文本处理或其他应用中使用。 如果你需要在 Python 中进行汉字到拼音的转换,可以考虑使用 xpinyin 库。你可以通过 pip 安装 x 阅读全文
posted @ 2024-05-09 14:38 larkwins 阅读(244) 评论(0) 推荐(0)
摘要: Github地址:https://github.com/bpython/bpython 在Python开发中,使用交互式命令行工具是一种高效的方式来测试代码、调试问题以及快速尝试各种功能。bpython库是一个优秀的交互式命令行工具,它提供了丰富的功能和友好的界面,使得Python开发者可以更加轻松 阅读全文
posted @ 2024-05-09 14:38 larkwins 阅读(172) 评论(0) 推荐(0)
摘要: Github地址:https://github.com/flexxui/flexx Click the image below for an interactive example: [ Flexx 是一个强大的 Python 库,用于创建交互式的 Web 应用程序和用户界面。它提供了灵活的组件和布 阅读全文
posted @ 2024-05-09 14:38 larkwins 阅读(230) 评论(0) 推荐(0)
摘要: 简介 python-magic是一个Python封装的文件类型识别库,它基于libmagic库。libmagic是一个强大的文件类型识别工具,它可以分析文件内容来确定文件的MIME类型。通过python-magic,我们可以在Python脚本中轻松地调用这个功能,无论是用于文件处理、上传下载的文件类 阅读全文
posted @ 2024-05-09 14:38 larkwins 阅读(506) 评论(0) 推荐(0)
摘要: Blackhole库是一个Python库,主要用于处理日志记录和调试信息的屏蔽。它提供了一种简单而灵活的方式来控制哪些日志消息应该被记录,哪些应该被丢弃。通过Blackhole库,开发人员可以轻松地管理日志信息的输出,避免不必要的日志记录,从而提高代码的可读性和性能。 在日常开发中,使用Blackh 阅读全文
posted @ 2024-05-09 14:38 larkwins 阅读(60) 评论(0) 推荐(0)
摘要: 在数据科学和自动化办公的世界里,处理Excel、Word等文件是一个常见且有时候颇为头痛的任务。传统的库虽然功能强大,但对于刚入门的朋友来说,学习曲线可能会相对陡峭。今天,我想向大家介绍一个简单、易用且功能强大的Python库——Calamine,它将是你处理电子表格数据的新利器。 Calamine 阅读全文
posted @ 2024-05-09 14:38 larkwins 阅读(1171) 评论(0) 推荐(0)
摘要: Manim是一个用于创建精美数学动画的库。它由3Blue1Brown的Grant Sanderson开发,特别适合于制作数学视频和演示文稿。 这个库让复杂数学概念的可视化变得既简单又有趣,无论是线性代数、微积分,还是更高级的数学主题,Manim都能让它们栩栩如生。 特点 动画生成: Manim库提供 阅读全文
posted @ 2024-05-09 14:38 larkwins 阅读(803) 评论(0) 推荐(0)
摘要: 前言 pyautogui库用于自动化GUI任务,它的主要优点在于跨平台性、功能丰富和易于使用,而缺点则包括安全性问题和对可视化环境的依赖。 优点方面: 跨平台性:pyautogui是跨平台的,可以在Windows、macOS和Linux等多种操作系统上运行。这意味着开发者可以编写一套自动化脚本,在不 阅读全文
posted @ 2024-05-09 14:38 larkwins 阅读(431) 评论(0) 推荐(0)
摘要: 你是否厌倦了不断地为您的应用程序实现各种复杂的身份验证协议? 有没有想过有一款万能钥匙,能够一次性解决 OAuth 1, OAuth 2 和 OpenID Connect 等多种身份验证与授权问题? 如果你的答案是肯定的,那么 Authlib 正是你的救星。在这个动态的互联网时代,保护用户数据的重要 阅读全文
posted @ 2024-05-09 14:37 larkwins 阅读(213) 评论(0) 推荐(0)
摘要: Rich —— 一个让程序更高级的 Python 库 在这个多彩缤纷的数字时代,命令行界面似乎太过单调乏味。 想象一下,如果你的终端输出能够像现代网页一样丰富多彩,是不是会带给你更愉快的开发体验? 这时,一个强大的库——Rich——悄然走进了你的视野。 它让颜色和样式的添加变得异常简单,不仅如此,它 阅读全文
posted @ 2024-05-09 14:37 larkwins 阅读(208) 评论(0) 推荐(0)
摘要: 什么是MoviePy? MoviePy是一个用Python编写的视频编辑库,它可以处理视频剪辑、合成、处理等各种任务。它背后的魔法来自于两个强大的工具:FFmpeg,一个处理多媒体数据的开源库;以及NumPy,一个强大的科学计算库。MoviePy让你可以用几行代码完成从视频剪辑到色彩调整的所有工作。 阅读全文
posted @ 2024-05-09 14:37 larkwins 阅读(1262) 评论(0) 推荐(0)
摘要: Python webassets库是一个用于管理 web 静态资源的工具,如CSS、JavaScript等,帮助开发者更有效地管理和优化网站的静态文件。本文将介绍如何安装和使用Python webassets库,以及它的特性、基本功能、高级功能、实际应用场景和总结部分。 安装 首先,需要安装Pyth 阅读全文
posted @ 2024-05-09 14:37 larkwins 阅读(125) 评论(0) 推荐(0)
摘要: Github地址:https://github.com/gunthercox/ChatterBot 在当今数字化时代,智能对话机器人成为了各行业的热门话题之一。Python ChatterBot库作为一款开源的对话机器人库,为开发者提供了构建智能对话系统的强大工具。本文将介绍如何安装ChatterB 阅读全文
posted @ 2024-05-09 14:37 larkwins 阅读(323) 评论(0) 推荐(0)
摘要: 1.连接mongodb ######### 方法一 ########## import pymongo # MongoClient()返回一个mongodb的连接对象client client = pymongo.MongoClient(host="localhost",port=27017) ## 阅读全文
posted @ 2024-05-09 14:37 larkwins 阅读(148) 评论(0) 推荐(0)
摘要: https://www.runoob.com/python3/python3-mysql.html 阅读全文
posted @ 2024-05-09 14:37 larkwins 阅读(17) 评论(0) 推荐(0)
摘要: 在C/C++语言中,struct被称为结构体。而在Python中,struct是一个专门的库,用于处理字节串与原生Python数据结构类型之间的转换。 本篇,将详细介绍二进制数据结构struct的使用方式。 函数与Struct类 struct库包含了一组处理结构值得模块级函数,以及一个Struct类 阅读全文
posted @ 2024-05-09 14:37 larkwins 阅读(662) 评论(0) 推荐(0)
摘要: NumPy 是 Python 科学计算的基础包,几乎所有用 Python 工作的科学家都利用了的强大功能。此外,它也广泛应用在开源的项目中,如:Pandas、Seaborn、Matplotlib、scikit-learn等。 Numpy全称Numerical Python。它提供了2种基本的对象:n 阅读全文
posted @ 2024-05-09 14:37 larkwins 阅读(94) 评论(0) 推荐(0)
摘要: 一. pyinstaller和Nuitka使用感受 1.1 使用需求 这次也是由于项目需要,要将python的代码转成exe的程序,在找了许久后,发现了2个都能对python项目打包的工具——pyintaller和nuitka。 这2个工具同时都能满足项目的需要: 隐藏源码。这里的pyinstall 阅读全文
posted @ 2024-05-09 14:37 larkwins 阅读(1172) 评论(0) 推荐(0)
摘要: binaascii 是一个用于在二进制和 ASCII 之间转换的模块。 b2a_base64 是 binaascii 模块中的一种方法,它将 base64 数据转换为二进制数据。下面是这个方法的一个例子: import base64 import binascii msg = "Tandrew" e 阅读全文
posted @ 2024-05-09 14:36 larkwins 阅读(39) 评论(0) 推荐(0)
摘要: https://mp.weixin.qq.com/s/Nq5Ygy0axI83H2dclU56yQ GeoPandas是一个Python开源项目,旨在提供丰富而简单的地理空间数据处理接口。 GeoPandas扩展了Pandas的数据类型,并使用matplotlib进行绘图。GeoPandas官方仓库 阅读全文
posted @ 2024-05-09 14:36 larkwins 阅读(428) 评论(0) 推荐(0)
摘要: difflib 是一个专注于比较数据集(尤其是字符串)的 Python 模块。为了具体了解您可以使用此模块完成的几件事,让我们检查一下它的一些最常见的函数。 SequenceMatcher SequenceMatcher 是一个比较两个字符串并根据它们的相似性返回数据的函数。通过使用 ratio() 阅读全文
posted @ 2024-05-09 14:36 larkwins 阅读(45) 评论(0) 推荐(0)
摘要: 前言 在程序中,有很多高效率的字符串处理方式,如果开发者能够完全掌握这些高效的字符串处理,往往在开发者也能事半功倍。比如针对于字符串的处理,也是自然语言处理的基础知识。 而python3中,处理字符串的库为:string。本篇将详细介绍各种字符串的高效处理方式。 首字母大写 对于英文单词组成的字符串 阅读全文
posted @ 2024-05-09 14:36 larkwins 阅读(789) 评论(0) 推荐(0)
摘要: 前言 time库运行访问多种类型的时钟,这些时钟用于不同的场景。本篇,将详细讲解time库的应用知识。 获取各种时钟 既然time库提供了多种类型的时钟。下面我们直接来获取这些时钟,对比其具体的用途。具体代码如下: import time print(time.monotonic()) print( 阅读全文
posted @ 2024-05-09 14:36 larkwins 阅读(250) 评论(0) 推荐(0)
摘要: 前言 datetime库也用于时间日期的处理,主要用于完成日期和时间的解析,格式化和算术运算。本篇,将完整的介绍datetime库的应用知识。 datetime.date 与time库一样,datetime库也有获取当前日期的类,日历日期值用datetime.date表示。比如datetime.da 阅读全文
posted @ 2024-05-09 14:36 larkwins 阅读(125) 评论(0) 推荐(0)
摘要: 前言 calendar库让你可以输出日历,它还提供了其它与日历相关的实用函数。本篇,就将详细讲解calendar库的使用规则。 prmonth()与TextCalendar() prmonth()是一个简单的函数,可以生成月的格式文本输出。具体用法如下所示: import calendar c = 阅读全文
posted @ 2024-05-09 14:36 larkwins 阅读(190) 评论(0) 推荐(0)
摘要: 前言 前文是针对普通的字符串数据进行处理。今天,我们要讲解的textwrap库,是对多文本进行处理的库。比如对于段落的缩进,填充,截取等,都可以通过textwrap库进行操作。 特别是自己编写打印程序的时候,可以使用该库进行校正文档非常便捷,大大的加快了文本格式的处理。话不多说,我们来一步步学习te 阅读全文
posted @ 2024-05-09 14:36 larkwins 阅读(128) 评论(0) 推荐(0)
摘要: 前言 os.path是平台独立的文件名管理库,使用该库能够很方便来处理多个平台上的文件。即使程序不打算在平台之间移值,也应当使用os.path库来完成可靠的文件名解析。 本篇博文将详细介绍os.path库的用法。 解析路径的基本用法 os.path中的第一组函数可以用来将表示文件名的字符串解析为文件 阅读全文
posted @ 2024-05-09 14:36 larkwins 阅读(83) 评论(0) 推荐(0)
摘要: 前言 Pathlib库提供了一个面向对象的API来解析,建立,测试和处理文件名和路径,而不是使用底层字符串操作。 其中Pathlib库有2个非常关键的类名:PurePosixPath,PureWindowsPath。它们可以在任意操作系统上实例化和使用,因为它们只处理文件名与目录名。 要实例化一个具 阅读全文
posted @ 2024-05-09 14:36 larkwins 阅读(98) 评论(0) 推荐(0)
摘要: 前言 在实际的开发中,经常会用到随机数生成。而random库专用于随机数的生成,它是基于Mersenne Twister算法提供了一个快速伪随机数生成器。 本篇,将详细讲解各种场景之下随机数的生成应用。 生成随机数 对于随机数的生成,random库提供了很多函数,有的负责生成浮点数,有的负责生成整型 阅读全文
posted @ 2024-05-09 14:35 larkwins 阅读(254) 评论(0) 推荐(0)
摘要: 前言 re库就是我们常说的正则表达式库,它是用一种形式化语法来描述的文本匹配模式。通过该库,我们可以匹配特定字符串中的一些内容,比如爬取网页内容时,我们可以通过re库获取网页内容中的所有标签内容。 本篇将详细讲解re库的使用规则。 查找文本 比如,在一串字符串文本中,我们需要查找一个子字符串是否在该 阅读全文
posted @ 2024-05-09 14:35 larkwins 阅读(75) 评论(0) 推荐(0)
摘要: 前言 在实际的项目处理中,往往我们并不需要创建文件,仅仅用于中转而已。这个时候在系统中频繁的创建中转文件,删除中转文件,不仅浪费系统的资源,而且容易被破坏或者篡改,这个时候用临时文件反而更好。 而Python给我们提供了临时文件操作库:tempfile。本篇将详细介绍临时文件的应用与处理。 创建临时 阅读全文
posted @ 2024-05-09 14:35 larkwins 阅读(250) 评论(0) 推荐(0)
摘要: 前言 什么算是高层的文件操作呢? 普通的文件操作,我们一般只涉及创建文件,文件夹以及写入文件等等。假如我现在需要复制一个文件的内容到另一个文件之中,用pathlib等都只能先打开复制文件,然后进行将其读出来保存,然后再写入新的文件,这种普通的复制操作,无形之中增加了许多步骤。 而shutil库可以直 阅读全文
posted @ 2024-05-09 14:35 larkwins 阅读(83) 评论(0) 推荐(0)
摘要: 前言 对于文件的比较一般有几种,比如比较文件的内容,比较文件的大小,或者直接对比整个项目文件。特别是在项目的更新迭代中,可以通过该库来比较当前版本与之前版本有哪些文件不同。 所以,本篇将详细讲解Python的文件比较库:filecmp。 生成示例文件 在比较文件之前,我们首先需要有用于比较的文件。所 阅读全文
posted @ 2024-05-09 14:35 larkwins 阅读(58) 评论(0) 推荐(0)
摘要: 前言 内存映射通常可以提高I/O的性能,因为使用内存映射时,不需要对每个访问都建立一个单独的系统调用,也不需要在缓冲区之间复制数据,内核和用户都能很方便的直接访问内存。 本篇,将详细介绍Python内存映射库:mmap。 mmap(读文件) 使用mmap()函数可以创建一个内存映射文件。该函数的第1 阅读全文
posted @ 2024-05-09 14:35 larkwins 阅读(274) 评论(0) 推荐(0)
摘要: 前言 subprocess库提供了一个API创建子进程并与之通信。这对于运行生产或消费文本的程序尤其有好处,因为这个API支持通过新进行的标准输入和输出通道来回传数据。 本篇,将详细介绍Python创建附加进行的库:subprocess。 run(运行外部命令) subprocess库本身可以替换o 阅读全文
posted @ 2024-05-09 14:35 larkwins 阅读(77) 评论(0) 推荐(0)
摘要: 前言 前面的subprocess库主要讲解的是进程知识与进程间的交互。而进程有可以拥有多个线程,所以threading库提供了管理多个线程执行的API,允许程序在同一个进程空间并发地运行多个操作。 本篇,将详细的介绍Python线程库:threading。 Thread对象 要使用threading 阅读全文
posted @ 2024-05-09 14:35 larkwins 阅读(104) 评论(0) 推荐(0)
摘要: 控制资源访问 前文提到threading库在多线程时,对同一资源的访问容易导致破坏与丢失数据。为了保证安全的访问一个资源对象,我们需要创建锁。 示例如下: import threading import time class AddThread(): def __init__(self, start 阅读全文
posted @ 2024-05-09 14:35 larkwins 阅读(221) 评论(0) 推荐(0)
摘要: 前言 一般来说,每个App都有一个意见反馈功能。对于企业,其意见反馈自然是发送到其服务器上,而对于个人应用来说,因为使用的人相对较少,在初期推广的时候,可以将意见反馈设置成发送到自己邮箱,这样可以节约服务器的资源开销。 而Python提供了smtplib库,其中SMTP类可以用来与邮件服务器通信发送 阅读全文
posted @ 2024-05-09 14:35 larkwins 阅读(466) 评论(0) 推荐(0)
摘要: 前言 multiprocessing库是基于threading API,它可以把工作划分为多个进程。有些情况下,multiprocessing可以作为临时替换取代threading来利用多个CPU内核,相应地避免Python全局解释器锁所带来的计算瓶颈。 下面,我们来看看multiprocessin 阅读全文
posted @ 2024-05-09 14:34 larkwins 阅读(62) 评论(0) 推荐(0)
摘要: 前言 ipaddress库提供了处理IPv4与IPv6网络地址的类。这些类支持验证,查找网络上的地址和主机,以及其他常见的操作。 本篇,将详细介绍Python中ipaddress库的使用规则。(内容涉及很多计算机网络知识,如果不懂,可以参考书籍《计算机网络》) 地址 一般来说,我们使用ipaddre 阅读全文
posted @ 2024-05-09 14:34 larkwins 阅读(218) 评论(0) 推荐(0)
摘要: 前言 既然在Pathlib库中提到了glob()函数,那么我们就专门用一篇内容讲解文件名的匹配。其实我们有专门的一个文件名匹配库就叫:glob。 不过,glob库的API非常小,但是仅仅应用于文件名的匹配绰绰有余。只要是在实际的项目中需要过滤,或者匹配一组文件,都可以使用该库进行操作。 通配符 星号 阅读全文
posted @ 2024-05-09 14:34 larkwins 阅读(182) 评论(0) 推荐(0)
摘要: 前言 hashlib库定义了一个API来访问不同的密码散列算法。其底层由OpenSSL提供,所以OpenSSL库提供的所有算法都可以用,包括: MD5 SHA1 SHA224 SHA256 SHA384 SHA512 当然,这上面列举的只是其支持的一部分。真正全部支持的种类读者可以用过下面代码打印出 阅读全文
posted @ 2024-05-09 14:34 larkwins 阅读(45) 评论(0) 推荐(0)
摘要: 前言 HMAC算法可以用于验证信息的完整性,这些信息可能在应用之间传递,或者存储在一个可能有安全威胁的地方。 其基本思路:生成实际数据的一个密码散列,并提供一个共享的秘密密钥。然后使用得到的散列检查所传输或存储的信息,以确定一个信任级别,而不传输秘密密钥。 消息签名 hmac库提供了一个new()函 阅读全文
posted @ 2024-05-09 14:34 larkwins 阅读(41) 评论(0) 推荐(0)
摘要: Socket网络通信套接字 socket库提供了一个底层C API,可以使用BSD套接字接口实现网络通信。它包括socket类,用于处理具体的数据通道,还包括用来完成网络相关任务的函数,如将一个服务器名转换为一个地址以及格式化数据以便在网络上发送。 什么是套接字? 套接字是程序在本地或者通过互联网来 阅读全文
posted @ 2024-05-09 14:34 larkwins 阅读(56) 评论(0) 推荐(0)
摘要: 前言 套接字除了用于分析网络地址等功能之外,还可以配置一个服务器,监听到来的消息。 比如你在网络上跟网络机器人聊天,你发送数据到机器人(服务器),然后机器人(服务器)反馈聊天数据信息给你。 当然,机器人的回复内容可能还涉及机器学习,但简单的消息反馈涉及的就是套接字的知识。 简单的搭建服务器与客户端 阅读全文
posted @ 2024-05-09 14:34 larkwins 阅读(86) 评论(0) 推荐(0)
摘要: 前言 前文使用TCP面向流的套接字,今天讲解的UDP的工作方式与TCP/IP不同。UDP是用户数据报协议,是一个面向消息的协议。 一方面,UDP不需要一个长期活动连接,所以建立UDP套接字稍微简单一些。另一方面,UDP消息必须放在一个数据报中。 在IPv4中,数据报包含65507个字节,这些字节信息 阅读全文
posted @ 2024-05-09 14:34 larkwins 阅读(52) 评论(0) 推荐(0)
摘要: 什么是组播 点对点连接可以处理很多通信需求,不过随着直接连接数的增加,在多对通信方之间传递相同的消息会变得越来越困难。 单独地向各个接收方发送消息会耗费额外的处理时间和带宽,这对于诸如完成流视频或音频操作的应用来说,代码会出现显著的性能问题。 而使用组播(multicast)向多个端点同时发送消息可 阅读全文
posted @ 2024-05-09 14:34 larkwins 阅读(487) 评论(0) 推荐(0)
摘要: 在处理庞大数据时,你是否常常感到焦急? pandas 虽广受欢迎,但在面对百万乃至千万级行数据的挑战时,它似乎慢得令人难以忍受。 更糟糕的是,大数据集处理不当还容易让我们的计算机 "喘不过气来",卡顿、崩溃、内存溢出成了日常。 但是,如果有一种方法能够令你继续沿用熟悉的 pandas API,同时大 阅读全文
posted @ 2024-05-09 14:34 larkwins 阅读(363) 评论(0) 推荐(0)
摘要: 今天给大家来介绍一款十分好用的可视化模块,D3Blocks,不仅可以用来绘制可动态交互的图表,并且导出的图表可以是HTML格式,方便在浏览器上面呈现。 仓库:https://github.com/d3blocks/d3blocks/ 文档:https://d3blocks.github.io/d3b 阅读全文
posted @ 2024-05-09 14:33 larkwins 阅读(303) 评论(0) 推荐(0)
摘要: Github地址:https://github.com/urwid/urwid Urwid 是一个功能强大的 Python 库,用于创建基于文本的用户界面(TUI)和终端应用程序。它提供了丰富的小部件和布局管理器,使开发者可以轻松构建具有交互性的终端界面。本文将详细介绍 Urwid 库的特性、用法, 阅读全文
posted @ 2024-05-09 14:33 larkwins 阅读(629) 评论(0) 推荐(0)
摘要: smtplib:提供了与 SMTP(简单邮件传输协议)服务器交互的功能,用于发送电子邮件。 email:用于创建和处理电子邮件消息,包括邮件内容、附件、元数据等。 安装 由于 smtplib 和 email 是 Python 的标准库,所以通常不需要单独安装。它们在安装 Python 的时候就已经包 阅读全文
posted @ 2024-05-09 14:33 larkwins 阅读(85) 评论(0) 推荐(0)
摘要: 什么是humanize? humanize是一个Python库,它提供了一系列的函数,用于将数字转换成更加易读易理解的格式。比如,它可以将一个非常大的数字转换成带有单位的格式(如将1234567890转换为“1.2亿”),或者将日期和时间转换成更自然的语言描述(如将日期差转换为“3天前”)。 hum 阅读全文
posted @ 2024-05-09 14:33 larkwins 阅读(92) 评论(0) 推荐(0)
摘要: Rapidfuzz 是为了满足现代数据处理中对于字符串匹配速度和准确性的双重需求而生的。 当我们提到字符串匹配,可能脑海中首先浮现的是正则表达式或者是传统的字符串比对方法。 然而,这些方法在处理模糊匹配上显得力不从心。 在模糊匹配的王国里,Levenshtein 和fuzzywuzzy 曾称霸一方, 阅读全文
posted @ 2024-05-09 14:33 larkwins 阅读(580) 评论(0) 推荐(0)
摘要: openpyxl是Python下的Excel库,它能够很容易的对Excel数据进行读取、写入以及样式的设置,能够帮助我们实现大量的、重复的Excel操作,提高我们的办公效率,实现Excel办公自动化。 安装方法:pip install openpyxl 中文文档:https://www.osgeo. 阅读全文
posted @ 2024-05-09 14:33 larkwins 阅读(274) 评论(0) 推荐(0)
摘要: 1. 安装模块 Windows用户打开命令行输入:pip install python-pptx Mac用户打开终端/Terminal输入:pip3 install python-pptx 使用windows系统,如果出现无法安装情况,可以在cmd模式下输入网址选择国内清华镜像。 pip insta 阅读全文
posted @ 2024-05-09 14:33 larkwins 阅读(1333) 评论(0) 推荐(0)
摘要: MarkupSafe转义字符,因此在HTML和XML中使用文本是安全的。具有特殊含义的字符将被替换,使其显示为实际字符。这减轻了注入攻击,意味着不受信任的用户输入可以安全地显示在页面上。 escape()函数转义文本并返回一个Markup对象。该对象将不再被转义,但与它一起使用的任何文本都将被转义, 阅读全文
posted @ 2024-05-09 14:33 larkwins 阅读(59) 评论(0) 推荐(0)
摘要: Alembic 是一款轻量型的数据库迁移工具,它与 SQLAlchemy 一起共同为 Python 提供数据库管理与迁移支持。 Alembic 的应用 Alembic 使用 SQLAlchemy 作为数据库引擎,为关系型数据提供创建、管理、更改和调用的管理脚本,协助开发和运维人员在系统上线后对数据库 阅读全文
posted @ 2024-05-09 14:33 larkwins 阅读(996) 评论(0) 推荐(0)
摘要: 安装 你可以从PyPI上直接安装这个库: pip install itsdangerous 适用案例 在取消订阅某个通讯时,你可以在URL里序列化并且签名一个用户的ID。这种情况下你不需要生成一个一次性的token并把它们存到数据库中。在任何的激活账户的链接或类似的情形下,同样适用。 被签名的对象可 阅读全文
posted @ 2024-05-09 14:33 larkwins 阅读(96) 评论(0) 推荐(0)
摘要: 许多教程使用的是 pip freeze > requirements.txt 指令,但是这个指令只能检索当前虚拟环境中安装的包。要想自动检索项目文件中的依赖包要使用pipreqs, 使用方法如下: 首先安装pipreqs pip install pipreqs 使用 在项目根目录下执行命令 pipr 阅读全文
posted @ 2024-05-09 14:32 larkwins 阅读(114) 评论(0) 推荐(0)
摘要: GoPUP 支持Python 3.7+,旨在使获取数据尽可能方便,主要用于学术研究目的。 GoPUP 项目所采集的数据皆来自公开的数据源,不涉及任何个人隐私数据和非公开数据。 同时本项目提供的数据接口及相关数据仅用于学术研究,任何个人、机构及团体使用本项目的数据接口及相关数据请注意商业风险。 部分接 阅读全文
posted @ 2024-05-09 14:32 larkwins 阅读(56) 评论(0) 推荐(0)
摘要: Boltons 使用的是 BSD 许可证,到目前为止已经收录 超过230个 的纯 Python实用工具库,这些工具库与 Python 标准库并没有重合,是补充的关系,包括: cacheutils 工具集:用于管理缓存,提供 LRU 和 LRI 等缓存方式 debugutils 工具库:用于调试实用程 阅读全文
posted @ 2024-05-09 14:32 larkwins 阅读(43) 评论(0) 推荐(0)
摘要: 一、 基本概念 1、 简介 requests 模块是 python 基于 urllib,采用 Apache2 Licensed 开源协议的 HTTP 库。它比 urllib 更加方便,可以节约我们大量的工作,完全满足 HTTP 测试需求。Requests 的哲学是以 PEP 20 的习语为中心开发的 阅读全文
posted @ 2024-05-09 14:32 larkwins 阅读(94) 评论(0) 推荐(0)
摘要: Gradio是一个开源库,用于仅使用Python构建易于使用且易于共享的应用程序。它特别适用于机器学习项目,旨在使测试、共享和展示模型简单直观。 安装 Gradio的安装非常简单,直接使用pip即可安装: pip install gradio 创建第一个程序 import gradio as gr 阅读全文
posted @ 2024-05-09 14:32 larkwins 阅读(575) 评论(0) 推荐(0)
摘要: 我们用 MySQL 客户端查询数据的时候,是以下面这种格式显示的: 内容展示的非常漂亮,而 Python 有一个第三方模块叫 prettytable,专门用来将数据以上面这种格式输出,喜欢记得收藏、关注、点赞。 我们来看一下详细介绍一下用法。 添加表头、添加行、添加列 类似于数据库中的表,由表头(或 阅读全文
posted @ 2024-05-09 14:32 larkwins 阅读(457) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2024-05-09 14:32 larkwins 阅读(64) 评论(0) 推荐(0)
摘要: psutil(process and system utilities)是一个全能型的跨平台库,用 Python 编写,旨在简化对系统监控和进程管理的编程工作。 它提供丰富的接口,让你能够轻松获取系统运行时的信息,涉及的范围包括但不限于进程、CPU、内存、磁盘、网络等。 这个强大的库起源于谁的想法? 阅读全文
posted @ 2024-05-09 14:32 larkwins 阅读(134) 评论(0) 推荐(0)
摘要: 一、PyMysql 在使用Python操作MySQL数据过的过程中,基本的增删改查操作如何更加高效优雅的执行。这里将以PyMySQL为例,介绍一下如何使用Python操作数据库。 Python对MySQL数据库进行操作,基本思路是先连接数据库 Connection 对象,建立游标 Cursor 对象 阅读全文
posted @ 2024-05-09 14:32 larkwins 阅读(226) 评论(0) 推荐(0)
摘要: https://mp.weixin.qq.com/s/eY1QXpwbTNSOd08Wfpg4sQ ①-PivotTableJS 无需任何代码就可以在Jupyter Notebook中交互式地分析数据。 https://pypi.org/project/pivottablejs/ ②-PyTube 阅读全文
posted @ 2024-05-09 14:32 larkwins 阅读(29) 评论(0) 推荐(0)
摘要: ![四款强大的%20Python%20可视化库-0](assets/四款强大的%20Python%20可视化库-0.png) ![四款强大的%20Python%20可视化库-1](assets/四款强大的%20Python%20可视化库-1.png) ![四款强大的%20Python%20可视化库-2](assets/四款强大的%20Python%20可视化库-2.png) ![四款强大的%20P 阅读全文
posted @ 2024-05-09 14:31 larkwins 阅读(44) 评论(1) 推荐(0)
摘要: pynvml 是一个 Python 包,用于与 NVIDIA 的管理库 NVML(NVIDIA Management Library)进行交互,以获取和监控 NVIDIA GPU 设备的信息。它提供了一组函数和类,可以查询 GPU 设备的状态、显存使用情况、温度、功耗等信息。 要使用 pynvml 阅读全文
posted @ 2024-05-09 14:31 larkwins 阅读(429) 评论(0) 推荐(0)
摘要: https://mp.weixin.qq.com/s/pHfjyvD7IkbBqQ66SxsGdg 阅读全文
posted @ 2024-05-09 14:31 larkwins 阅读(16) 评论(0) 推荐(0)
摘要: 在日常开发工作中,经常会遇到这样的一个问题:要对数据中的某个字段进行匹配,但这个字段有可能会有微小的差异。比如同样是招聘岗位的数据,里面省份一栏有的写“广西”,有的写“广西壮族自治区”,甚至还有写“广西省”……为此不得不增加许多代码来处理这些情况。 今天跟大家分享FuzzyWuzzy一个简单易用的模 阅读全文
posted @ 2024-05-09 14:31 larkwins 阅读(143) 评论(0) 推荐(0)
摘要: 很多算法工程师在完成数据分析、模型训练或者项目总结的时候,往往只能通过ppt汇报,添加数据图表、截图模型实验结果等。如果想提供一个前端演示demo,通常可以搭建flask服务,但是flask需要学习很多前端知识,如css、html等,这又是一个深之又深的坑。那有没有什么工具能够跳过这些模块,直接提供 阅读全文
posted @ 2024-05-09 14:31 larkwins 阅读(576) 评论(0) 推荐(0)
摘要: https://mp.weixin.qq.com/s/b7-zb0FygFhiL6kfbNoazw https://mp.weixin.qq.com/s/7RNufhpQYxcq7uvl6DVuQQ 阅读全文
posted @ 2024-05-09 14:31 larkwins 阅读(70) 评论(0) 推荐(0)
摘要: 前言 在现代计算机应用程序开发中,图形用户界面(GUI)是用户与程序交互的重要组成部分。然而,GUI 开发往往需要大量的代码和复杂的布局,给开发者带来了一定的挑战。在本篇博文中,将介绍 nicegui,它是一个简单易用的图形用户界面库,提供了一种简化 GUI 开发的方式,使开发者能够更快速地构建吸引 阅读全文
posted @ 2024-05-09 14:14 larkwins 阅读(1998) 评论(0) 推荐(0)