刷新
格式塔原理:数据可视化如何引导观众的注意力

博主头像 在数据分析中,我们常说:“一张好的图表胜过千言万语。” 但很多时候,我们做出来的图表却是“千言万语堵在心口难开”。读者看了半天,抓不住重点。 这是为什么? 因为人类的视觉感知遵循一套被称为 格式塔(Gestalt) 的心理学原理。 简单来说,当我们看到一组物体时,大脑会自动将它们视为一个整体或一种模 ...

回归分析全家桶(16种回归模型实现方式总结)

博主头像 提到回归分析,很多人第一时间想到的只有“线性回归”和“逻辑回归”。但实际上,针对不同的数据情况(比如有离群点、数据是计数的、数据有缺失截断等),我们有十几种回归模型可以选择。 今天为大家总结了 16种回归分析 的模型,重点不是介绍这些回归模型的原理,而是介绍如何在Python代码中使用这些模型,希望 ...

Python 将 PDF 表格数据提取至 TXT 或 Excel

博主头像 在数据处理与办公自动化场景中,PDF 表格因格式稳定被广泛使用,但不可直接编辑的特性,给数据统计、分析和二次加工带来诸多不便。手动复制粘贴不仅效率低下,还容易出现数据错位、遗漏等问题。 本文将分享一种高效的解决方案—基于Python结合Spire系列库,实现 PDF 表格数据的精准提取,并分别导出为 ...

Python uv 简明教程

告别依赖地狱:用 uv 重塑你的 Python 开发体验 如果你长期使用 Python,一定对下面这些场景不陌生: 创建一个新项目,pip install 了几个包,忽然发现版本冲突,陷入无尽的 pip install 和 pip uninstall 循环。 项目依赖文件 requirements. ...

数据分析师的“水晶球”:时间序列分析

博主头像 很多刚入行的小伙伴问我:“我想预测下个月公司的销售额,或者预测一下明天的股价,该学什么?” 我的回答通常只有六个字:时间序列分析。 如果在数据分析的世界里有一种魔法能让你“预知未来”,那一定就是它。 1. 什么是时间序列? 别被名词吓到了。简单来说,时间序列(Time Series)就是按时间顺序排 ...

①搭建vimo-desktop本地运行环境

博主头像 Vimo-desktop是VideoRAG的前端实现。 目前该项目仍是不稳定阶段,在环境配置上也遇到了很多问题。 一、conda 环境配置 conda create --name vimo python=3.11 conda activate vimo 1、pytorch需要安装GPU版本,且最好用 ...

拒绝“凭感觉”:用回归分析看透数据背后的秘密

博主头像 在数据分析的江湖里,有一个绝对的核心技能,叫做回归分析(Regression Analysis)。 无论你是刚入行的新手,还是想要进阶的老手,掌握它,你就拥有了预测未来的“水晶球”。 很多初学者一听到“回归”两个字,脑子里全是复杂的数学公式,立刻想打退堂鼓。 别急!今天我们不讲枯燥的数学推导,只讲它 ...

国产化Excel开发组件Spire.XLS教程:使用Python批量删除Excel分页符

博主头像 Excel 中多余或不必要的分页符,往往会打乱工作表的整体布局,甚至导致打印结果出现分页不合理、内容被截断等问题。这类分页符通常在修改打印设置、调整页边距,或切换视图模式后出现。本文将介绍如果借助Spire.XLS,使用Python批量删除Excel分页符,掌握如何正确删除它们是保持工作表结构清晰、... ...

在PySide6/PyQt6的项目中封装一些基础类库,包括文件对话框、字体对话框、颜色对话框、消息对话框等内容

博主头像 在我们实际开发项目的时候,有时候为了使用方便,会针对一些常用到的内容进行一定的封装处理,以降低使用的难度和减少相关代码,本篇随笔介绍在PySide6/PyQt6的项目中封装一些基础类库,包括文件对话框、字体对话框、颜色对话框、消息对话框等内容。通过上面的简单封装,我们就可以很容易的记得相关的处理函数... ...

通过 Python 在 Excel 中添加或删除图片

博主头像 在数据处理与办公自动化场景中,Excel 文件常需嵌入图片以增强可视化表达。然而,手动添加或删除图片不仅效率低下,还容易出错。如何用 Python 实现 Excel 中图片的自动化管理?答案是:使用 Free Spire.XLS for Python 免费库。 本文将系统介绍如何通过 Python ...

数据点的“社交距离”:衡量它们之间的相似与差异

博主头像 在数据分析的世界里, “距离” 不仅仅是地图上两点之间的路程。 距离 ,本质上是衡量两个事物 “相似度” 的尺子。 距离越近 = 相似度越高 距离越远 = 差异越大 如果你想做用户画像聚类、想做商品推荐系统,或者想识别信用卡欺诈交易,你首先要选对这把“尺子”。 本文将带你全面了解数据分析中常用的各种 ...

在windows平台搭建一个mini版本的k8s集群

前置要求: 1. 安装wsl2和docker-desktop 这边安装步骤之类的网上都有,最后要达成的效果就是二者都安装ok,同时要用wsl2起一台Linux虚机即可 2.安装kubectl curl -LO "https://dl.k8s.io/release/$(curl -L -s https ...

doc-llm-autotest 基于大模型的文档自动化测试平台:worker服务的可靠性增强

一、可靠性分析 从架构图上,我们可以看出worker调用大模型服务过程中,会发生阻塞等待,如果此时worker异常容器挂掉了,那么此次任务状态会一直为processing,并且因为redis关联task_id的消息已经被消费了,那么这个任务就无法被识别出来重试。 基于这个场景分析,我们要补充巡检服务 ...

数据会说谎?三大推断方法帮你“审问”数据真相

博主头像 很多刚入行甚至想入行数据分析的朋友,往往会陷入一个误区:以为数据分析就是不停地做报表、画饼图。 其实,数据分析的核心魅力在于 “推断”——即见微知著。 在现实生活中,我们很难获取“全量数据”(比如你不可能调查全国每一个人的身高),那么,如何通过手中的“小样本”去推测“大总体”的规律? 这就需要用到统 ...

<1234···22>