2025 年 6月 19 日随笔档案 - jack-chen666

2025年6月19日

摘要：目录第一部分：位置编码技术发展简史阶段一：绝对位置编码 (Absolute Positional Encoding)阶段二：相对位置编码 (Relative Positional Encoding)阶段三：旋转位置编码 (Rotary Positional Embedding, RoPE)第二部分：阅读全文

posted @ 2025-06-19 21:10 jack-chen666 阅读(810) 评论(0) 推荐(0)

大模型-qwen3 MoE 详细解读-68

摘要：目录代码一、MoE 核心思想：为什么要用“混合专家”？二、代码逐层深度解读三、总结与设计思考代码 class Qwen3MoeSparseMoeBlock(nn.Module): def __init__(self, config): super().__init__() self.num_exp 阅读全文

posted @ 2025-06-19 20:50 jack-chen666 阅读(523) 评论(0) 推荐(0)

大模型-权重绑定: tie_word_embeddings技术的来龙去脉-67

摘要：目录代码先说结论：模型不再需要为 lm_head 单独学习一个巨大的权重矩阵，而是直接“重用”embedding 的权重。一、核心思想：模型的“输入”与“输出”为何要关联？要理解权重绑定，我们首先要理解语言模型的两个关键部分：词嵌入层 (Input Embedding Layer)：作用阅读全文

posted @ 2025-06-19 20:38 jack-chen666 阅读(499) 评论(0) 推荐(0)

大模型-qwen3 模型结构解读-66

摘要：目录Decoder-Only架构代码解读Qwen3Attention - 注意力模块Qwen3MLP - 前馈网络模块Qwen3DecoderLayer - 单个解码器层Qwen3Model & Qwen3ForCausalLM - 顶层封装总结参考：https://zhuanlan.zhihu. 阅读全文

posted @ 2025-06-19 20:19 jack-chen666 阅读(2554) 评论(1) 推荐(1)

大模型-张量并行 (Tensor Parallelism) 和算子融合 (Operator Fusion)技术-65

摘要： class MergedColumnParallelLinear(ColumnParallelLinear): def __init__( self, input_size: int, output_sizes: list[int], bias: bool = False, ): self.outp 阅读全文

posted @ 2025-06-19 19:43 jack-chen666 阅读(367) 评论(0) 推荐(0)

大模型-大模型权重文件打包技术-64

摘要：好的，完全没有问题。我们来用中文详细介绍一下大模型中 “打包模块 (Packed Modules)” 和 “权重打包 (Weight Packing)” 这项关键技术。这项技术并不是单一的某个方法，而是一系列优化策略的统称。它的核心目标非常明确：在保证模型效果的同时，大幅提升大模型的推理性能（速度阅读全文

posted @ 2025-06-19 17:00 jack-chen666 阅读(171) 评论(0) 推荐(0)

大模型-大模型权重文件的加载2-63

摘要：这段代码的核心目标是高效、安全地将预训练好的大模型权重从硬盘加载到内存（或指定的计算设备）中，并正确地赋值给 nn.Module 模型实例的各个参数。vLLM 是一个为大语言模型（LLM）推理设计的、非常高效的库，因此它的权重加载逻辑也经过了特殊优化，以处理模型并行、量化等复杂情况。下面我们将逐行阅读全文

posted @ 2025-06-19 16:41 jack-chen666 阅读(287) 评论(0) 推荐(0)

大模型-大模型权重文件的加载-62

摘要： safetensor 权重文件的加载详细过程深入理解大模型 Safetensors 权重文件的加载过程作为一名大模型算法工程师，你肯定知道权重文件对于模型的运行至关重要。传统的 PyTorch 模型权重通常保存为 .bin 或 .pth 格式，这些格式在加载时存在一些安全隐患和效率问题。而 S 阅读全文

posted @ 2025-06-19 00:10 jack-chen666 阅读(590) 评论(0) 推荐(0)

红豆生南国是很遥远的事情

种豆南山下 github

公告

红豆生南国 是很遥远的事情

种豆南山下 github

公告

红豆生南国是很遥远的事情