刷新
数据“显微镜”:蜂群图让每个数据点都发声

博主头像 想象一下夏日的花丛中,成群的蜜蜂围绕着花朵忙碌地飞舞。每只蜜蜂都是一个独立的数据点,它们既保持群体聚集的形态,又不会完全重叠在一起。 这就是蜂群图(Swarm Plot)的核心理念——在有限的空间内展示所有数据点,让每个点都能被清晰看见。 蜂群图是一种特殊的数据可视化图表,它将分类数据与数值数据结合 ...

Python 高效实现 Excel 转 TXT 文本

博主头像 在数据处理场景中,将Excel文件转换为纯文本(TXT)格式便成为了一个常见的需求。传统的手动复制粘贴,不仅效率低下,更容易因格式不兼容、数据量庞大而引发错误。本文将解析如何通过 Spire.XLS for Python 实现 Excel 转 TXT 的高效、无依赖操作,提升数据处理效率和灵活性。 ...

从pcap文件提取sip信令文本

博主头像 操作系统版本: window10_x64 python版本: 3.9.13 libpcap版本:1.11.0b8 日常开发中,会遇到批量查找sip信令文本或直接分析sip文本的情况,文本形式的sip信令可直接使用grep查找或者进行文本分析。但是,如果拿到的是pcap文件,查找或者文本分析就没那么方 ...

面积图的奇妙变形:流图与地平线图

博主头像 想象一下面积图就像一层层叠起来的彩色玻璃片,每一层代表一个类别,从下往上堆叠,形成整体的视觉冲击。 但有时我们需要更特别的方式来展示数据的变化:是像河流一样蜿蜒流淌,还是像地平线上的群山连绵起伏? 今天,本文将介绍两种创意面积图变体——流图和地平线图,它们能让你的时间序列数据讲述更生动的故事。 1. ...

如何用 Python 将 Markdown 转换为 Word 文档

博主头像 在当今的技术文档工作流中,Markdown 因其简洁的语法和版本控制友好的特性,已成为开发者和技术写作者的首选格式。然而,在企业环境中,Word 文档仍然是正式报告、客户交付物和标准化文档的主流格式。 本文将分享如何使用 Free Spire.Doc for Python—一款免费的 Python ...

折线图的奇妙变奏:四种创意可视化方法

博主头像 想象一下折线图就像一条普通的公路,它能带我们从A点到达B点。 但有时我们需要更特别的路线:环岛、盘山公路、波浪形赛道或螺旋上升的通道。 在数据可视化中,标准的折线图有时无法充分展示数据的特性,这时我们就需要一些创意变种。 今天将介绍四种特别的折线图变体,它们各有所长,能让你的数据故事更加生动。 1. ...

从“2D转3D”看计算机图形学的数学本质

博主头像 从“2D转3D”看图形学的数学本质 在上一篇《从 0 构建 WAV 文件》中,我们拆解了音频文件的底层:它不过是按规则排列的二进制采样点。当时我们得出了一个结论:计算机的世界没有魔法,只有朴素的规则。 当你玩《黑神话:悟空》或《赛博朋克 2077》时,你是否好奇过:屏幕明明是一个平面,为什么我们能从 ...

哑铃图:数据对比的优雅之选

博主头像 简洁的线条连接两个数据点,就像哑铃的两端,在对比分析中展现出令人惊艳的清晰度。 在平时的数据分析项目中,我经常会遇到比较两个相关数据集的变化情况。 这时,传统的做法是使用堆积条形图或簇状条形图,但它们存在一个共同问题:当我们需要精确追踪每个项目在两个时间点或两种条件下的变化时,这些图表会让我们的眼睛 ...

RAG 为什么总是“看起来能用,实际不好用”?

博主头像 RAG 真正让人头疼的地方,从来不是“搭不起来” 如果你已经做过一段时间 RAG,大概率会有一种非常熟悉的感觉: 系统是能跑的,流程也是完整的,embedding 用的也不差,向量库、召回、rerank 该有的都有,但整体效果始终差点意思。 有时候是召回的内容看起来“擦边”, 有时候是答案明明就在文 ...

PPO 为何成了大模型微调“最后的底牌”?一篇真正能跑通的工程实战指南

博主头像 PPO 为何成了大模型微调“最后的底牌”?一篇真正能跑通的工程实战指南 开篇:无数大模型,是怎么被「一行 PPO 参数」训废的 如果你真正做过大模型微调,大概率经历过这些瞬间: reward 曲线一路狂飙,但模型开始胡说八道 模型突然学会“拍马屁”,却忘了基本常识 微调前还能正常回答,微调后像换了个 ...

打破堆积困局:优化堆积条形图的对比效果

博主头像 在数据可视化中,堆积条形图 擅长展示 “整体与构成” 的关系,但当每个柱子内的分段超过4个时,读者很难同时追踪各段的长度、位置与颜色映射, 误读概率显著上升。 更糟的是,若不同类别的总量差异很大,堆积结构会放大视觉错觉,导致“看起来差不多”的结论失真。 今天,本文将尝试探索一下改进堆积条形图的呈现方 ...

16G显卡也能调大模型?先搞懂显存消耗的3大核心原因

博主头像 16G显卡也能调大模型?先搞懂显存消耗的3大核心原因 (一)引言:为什么显存是大模型微调的“拦路虎”? 大家好,我是七七,看到经常有网友:“博主,我用16G显卡微调7B模型,一跑就报OOM(显存溢出),是不是必须换24G以上的卡?”“同样是微调13B模型,为什么别人单卡能跑,我却要多卡并行?” 其实 ...

你真的会用 Python 的 print 吗?

博主头像 大家好!今天我们来聊聊Python里最 “平平无奇” 却又无处不在的print()函数。 作为Python开发者,我们几乎每天都在用它,但你真的了解它的所有玩法吗? 其实很多时候,我们只用了它 10% 的功力。 今天,我们就来扒一扒 print 函数的“隐秘角落”。 掌握了它的几个参数,保证让你在同 ...

pyqt图形化显示—5.多个界面

博主头像 经过上述,已经能创建一个简陋的界面了。下面就扩展一下,创造多个界面,并实现界面间的参数传递。 子界面 界面 参考之前的MyWidget类 我们可以创建一个子界面SubWindow class SubWindow(QWidget): def __init__(self): super().__init ...

当条形图遇上极坐标:径向与圆形条形图的视觉革命

博主头像 想象一下,你正站在一个圆形广场的中心,周围均匀排列着12根高度不同的灯柱,这就是径向条形图带给我们的视觉体验。 在数据可视化领域,我们常常满足于传统的直角坐标系条形图,但当数据具有周期性或比较性时,径向条形图和圆形条形图为我们打开了新的可能性。 1. 设计原理 这两种图表把传统的笛卡尔坐标系换成极坐 ...

123···23>