摘要: DeepPrune: Parallel Scaling without Inter-trace Redundancy http://arxiv.org/abs/2510.08483 TL;DR LLM 进行并行思考时会产生很多导向相同结果的冗余路径。本文使用一个微调的 LLM 来在推理早期判断两条路 阅读全文
posted @ 2025-10-15 11:05 Eslzzyl 阅读(27) 评论(0) 推荐(0)
摘要: http://arxiv.org/abs/2503.16419 为避免混淆,本文将 inference 翻译为推理,将 reasoning 翻译为思考。 背景 一些主流的 CoT 变体: Self-Consistency 采样多个思考路径,然后选择最一致的答案。 Tree-of-Thought 将思 阅读全文
posted @ 2025-10-14 11:10 Eslzzyl 阅读(72) 评论(0) 推荐(0)
摘要: Sunshine 基地版 是一个很好的软件,自带了虚拟显示器,能够非常方便地实现熄屏串流,但有一个 bug,它会在串流结束后自动开启虚拟显示器的 HDR 功能:https://github.com/qiin2333/Sunshine-Foundation/issues/13 很不幸我恰巧又在使用一个 阅读全文
posted @ 2025-10-05 17:12 Eslzzyl 阅读(1714) 评论(0) 推荐(0)
摘要: 近期在某二手平台入手了一台 MacBook Pro,由此开启了 macOS 的使用历程。这里记录一下自己认为有价值的内容。你也可以认为这是一个从 Windows 切换到 macOS 的实用经验贴。 本文可能会不时更新。 设备和系统信息 机型:MacBook Pro 2021(14 英寸) 处理器:A 阅读全文
posted @ 2025-10-01 17:32 Eslzzyl 阅读(49) 评论(0) 推荐(0)
摘要: Visio 在导出 PDF 时会压缩图中的嵌入图片。为了避免图片被(严重)压缩,可以按照以下步骤进行操作: 点击 文件-打印,打印机选择“Microsoft Print to PDF”,根据图的版式选择横向或纵向,然后点击底部的“页面设置”小字。 如果图片中有阴影等效果,打印时需要选中“高质量”选项 阅读全文
posted @ 2025-09-05 17:03 Eslzzyl 阅读(284) 评论(0) 推荐(0)
摘要: 我的电脑上长期运行了一个 Qwen3 4B 模型,用于沉浸式翻译和 Cherry Studio 中的话题命名以及翻译任务。在过去的约半年时间内,我一直使用 llama.cpp 来部署 Q4 量化的 GGUF 模型。最近,为了获得更好的并发性能,我计划将推理框架改为 vLLM/SGLang。 我的环境 阅读全文
posted @ 2025-08-13 20:42 Eslzzyl 阅读(259) 评论(0) 推荐(0)
摘要: 本文是 Stanford CS336 课程学习记录的一部分。 撰写本文时,模型尚未经过训练,尽管模块可以通过测试,但可能仍然存在一些潜在问题。本文仅供参考。 概述 在 CS336 课程的作业 1 中,要求我们基于 PyTorch 框架自己实现一个 Transformer 语言模型并训练它。本文记录模 阅读全文
posted @ 2025-08-03 18:00 Eslzzyl 阅读(153) 评论(0) 推荐(0)
摘要: 简介 本文介绍(经过多次踩坑摸索出来的)在 Windows 系统、AMD Radeon 680M 核显上运行 llama.cpp 的方法。 Radeon 680M 是 AMD Ryzen 6000 系列移动处理中的中高端型号(7、9)搭载的核显: Ryzen 7 6800U: 2200 MHz Ry 阅读全文
posted @ 2025-02-09 22:00 Eslzzyl 阅读(2693) 评论(1) 推荐(1)
摘要: 昨天看到的一个项目:https://github.com/multimodal-art-projection/YuE 简介 在生成音乐,特别是带歌词的歌曲这方面的开源模型要远远落后于比闭源模型的。目前领先的闭源音乐模型是 Suno:https://suno.com/ 然而,Suno 不仅闭源,还不提 阅读全文
posted @ 2025-01-29 13:14 Eslzzyl 阅读(1478) 评论(0) 推荐(0)
摘要: 最近在使用电脑时发现了这个问题。这是一个由 Windows 远程桌面、Chromium 和微软拼音输入法共同引发的问题,可以通过以下的步骤复现: 在一台 Windows 电脑上安装并使用微软拼音输入法。 打开任何一个基于 Chromium 的软件(也包括任何基于 Electron 的软件),如 Ed 阅读全文
posted @ 2024-11-26 13:33 Eslzzyl 阅读(356) 评论(1) 推荐(1)