doc-llm-autotest 基于大模型的文档自动化测试平台:worker服务的可靠性增强
一、可靠性分析 从架构图上,我们可以看出worker调用大模型服务过程中,会发生阻塞等待,如果此时worker异常容器挂掉了,那么此次任务状态会一直为processing,并且因为redis关联task_id的消息已经被消费了,那么这个任务就无法被识别出来重试。 基于这个场景分析,我们要补充巡检服务 ...
数据会说谎?三大推断方法帮你“审问”数据真相
很多刚入行甚至想入行数据分析的朋友,往往会陷入一个误区:以为数据分析就是不停地做报表、画饼图。 其实,数据分析的核心魅力在于 “推断”——即见微知著。 在现实生活中,我们很难获取“全量数据”(比如你不可能调查全国每一个人的身高),那么,如何通过手中的“小样本”去推测“大总体”的规律? 这就需要用到统 ...
doc-llm-autotest 基于大模型的文档自动化测试平台::用户提交文件进行文档测试
一、技术选型与功能设计 使用minio服务,进行文件的中转与存储。用户提交文件到doc-llm-controller,控制面将文件转存到minio中,关联此次任务id。然后doc-llm-worker轮询redis发现有需要执行的任务,拿到id后,根据id从minio拿取文件,然后将文件解析成结构化 ...
国产化Word处理组件Spire.DOC教程:通过Python将HTML转换为TXT文本
通过 Python 将 HTML 转换为文本,推荐使用 Spire.Doc for Python 实现转换。该 Python Word 库不仅是轻量高效的 HTML 转文本工具,还支持几乎所有 Word 操作(如创建、内容编辑等),兼容性强、上手简单。 ...
在PySide6/PyQt6的项目中实现样式切换处理
在桌面应用开发中,“主题切换(深色 / 浅色模式)”已经不再是锦上添花的功能,而是逐渐成为一种用户刚需。尤其对于长时间使用的 ERP 工具类应用来说,良好的视觉舒适度对用户体验影响巨大。本篇随笔针对PySide6/PyQt6的项目的实现案例,介绍如何实现样式切换处理。 ...
markdown文档格式分析,再使用python对md文件进行结构化拆解
一、markdown文档 Markdown 文档本质上是:一个树状结构(Block 级) + 行内结构(Inline 级) Block 级元素(结构): heading_open → inline → heading_close paragraph_open → inline → paragraph ...
用样本猜总体的秘密武器,4大抽样分布总结
数据分析时,我们经常需要从样本数据推断总体特征。 而抽样分布就是连接样本与总体的重要桥梁,如果你不理解它,就无法理解为什么我们可以通过调查几千人来预测全国的选举结果,也无法理解A/B测试背后的逻辑。 本文将尽量使用大白话和Python代码,带你彻底搞懂抽样分布,并掌握最常用的四大分布:Z分布、T分布 ...
python调用大模型api来进行对话
一、Openai的接口调用 pip包下载 pip install openai 配置sk,url OPENAI_API_KEY = sk-xxxxx OPENAI_BASE_URL = https://api.openai.com/v1 接口调用 import os from flask impor ...
如何在Python开发中实现无代码、纯配置的业务界面展示和常规数据操作的处理分析过程
要实现无代码、纯配置的业务界面展示和常规数据操作,最佳的方式是通过实体-属性-值的设计方式,也就是常说的EAV模式,通过动态构建实体类型、动态构建对应的属性列表,以及根据类型的不同对属性值进行存储,从而构建一系列的处理规则,实现业务模块的动态化,本篇随笔探讨一下,如何在Python开发中实现无代码、... ...
【python】字典数据结构的设计原理学习
先说结论: python的dict,底层是哈希表(hash table)与开放寻址方案(二次探测 + 伪随机跳跃) 其中, 核心结构:哈希表是一个“数组” 每个 dict 底层对应一块数组(table),数组每个槽位(slot)可能存一个 key-value。 index: 0 1 2 3 4 5 ...
监听小工具-股票监控神奇九转分钟线信号触发提醒工具V2.0
本文介绍了一款基于Python开发的股票监控工具V2.0,主要针对神奇九转策略设计。该工具采用Tkinter GUI框架,集成Matplotlib等图表库,支持沪深A股实时数据获取、九转算法分析、K线展示及智能提醒功能。具备双模式界面、分钟级监控、点位管理及日志系统,已完成核心算法实现、数据可视化及... ...
Manim v0.19.1 发布啦!三大新特性让动画制作更丝滑
大家好!Manim 社区刚刚发布了 v0.19.1 版本(发布于 12 月 1 日)。虽然这是一个小版本号更新,但里面可是藏着几个非常实用的新功能! 无论你是刚入坑的新手,或者已经被某些痛点折磨过的老手,这篇更新速览都值得一看。 1. 亮点一:终于可以“固定”随机颜色了! 以前我们在使用 ra ...
讲讲django的文件对象
一、django文件对象是什么? Django 抽象出了一套“文件处理体系”,核心是: Django 所有文件类的基类 提供统一的接口用于: 读取 写入 迭代 存储到 Storage 后端(本地/OSS/S3) 使用FileField / ImageField来构造: class MyModel(m ...
[python]FastAPI - 全链路日志追踪 Tracking ID 的设计
本文介绍如何基于 contextvars,为每次请求的完整流程都添加一个 tracking_id,并在日志中自动记录,便于全链路追踪。 ...
告别盲人摸象,数据分析的抽样方法总结
当你踏入数据分析的大门时,可能会被海量的数据淹没,感到无从下手。 想象一下,你想了解一座巨大森林里所有树木的平均高度,难道要一棵一棵地去测量吗?这显然不现实。 这时,“抽样” 这个强大的工具就该登场了! 本文将带你全面了解各种抽样方法,并用Python代码演示实际应用。 1. 抽样是什么? 抽样 是 ...
【首选】PDF转视频教程:20秒一键将PDF转换为视频软件
一、背景介绍 大家好,我是王哪跑,现在很多做小学初中高中学习资料相关的教师或出售虚拟资料的网赚达人,都会将PDF电子档转换为视频,并发布到对应的短视频平台进行引流变现,但是使用传统的视频剪辑软件,花费的时间可能会比较长。 基于此,我用python开发了这个一键将PDF转视频的软件,只需30秒完成PD ...
虚拟资料必备!Python开发的PDF批量加水印软件,真的去不掉!
1、前言 做虚拟资料的你,手上肯定都会有一大堆PDF文件,比如做小学资料、教案资料的朋友,给PDF文件加上水印是必不可少的步骤,通过这种在pdf文件加水印的方式可以实现被动化的引流。 但是自己一个个给PDF文件添加水印费时费力,用市面上常用的软件一键添加,也都是可以一键去除的。别急,今天带来一款老王 ...
Manim进阶:用背景图片让你的数学视频脱颖而出
做Manim动画久了,你是否厌倦了那万年不变的黑色虚空? 很多初学者(甚至老手)都想给动画加个背景图,但往往会遇到两个问题: 怎么加? 是把图片放进去,还是设置相机? 看不清! 背景花里胡哨,前面的文字公式瞬间“隐身”了。 今天,我们就来揭开Manim动画中一个简单却强大的技巧--为动画添加背景。 ...
有用的包 #Python
整理一点有用的包,持续更新中~ pandas 数据处理神器,一维、二维数据,安装命令pip install pandas 读取文件 import pandas as pd df = pd.read_csv("data.csv") # 读取 CSV 文件 df = pd.read_excel("dat ...


