上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 32 下一页
摘要: 目录代码一、MoE 核心思想:为什么要用“混合专家”?二、代码逐层深度解读三、总结与设计思考 代码 class Qwen3MoeSparseMoeBlock(nn.Module): def __init__(self, config): super().__init__() self.num_exp 阅读全文
posted @ 2025-06-19 20:50 jack-chen666 阅读(523) 评论(0) 推荐(0)
摘要: 目录代码 先说结论: 模型不再需要为 lm_head 单独学习一个巨大的权重矩阵,而是直接“重用”embedding 的权重。 一、核心思想:模型的“输入”与“输出”为何要关联? 要理解权重绑定,我们首先要理解语言模型的两个关键部分: 词嵌入层 (Input Embedding Layer): 作用 阅读全文
posted @ 2025-06-19 20:38 jack-chen666 阅读(499) 评论(0) 推荐(0)
摘要: 目录Decoder-Only架构代码解读Qwen3Attention - 注意力模块Qwen3MLP - 前馈网络模块Qwen3DecoderLayer - 单个解码器层Qwen3Model & Qwen3ForCausalLM - 顶层封装总结 参考:https://zhuanlan.zhihu. 阅读全文
posted @ 2025-06-19 20:19 jack-chen666 阅读(2555) 评论(1) 推荐(1)
摘要: class MergedColumnParallelLinear(ColumnParallelLinear): def __init__( self, input_size: int, output_sizes: list[int], bias: bool = False, ): self.outp 阅读全文
posted @ 2025-06-19 19:43 jack-chen666 阅读(367) 评论(0) 推荐(0)
摘要: 好的,完全没有问题。我们来用中文详细介绍一下大模型中 “打包模块 (Packed Modules)” 和 “权重打包 (Weight Packing)” 这项关键技术。 这项技术并不是单一的某个方法,而是一系列优化策略的统称。它的核心目标非常明确:在保证模型效果的同时,大幅提升大模型的推理性能(速度 阅读全文
posted @ 2025-06-19 17:00 jack-chen666 阅读(171) 评论(0) 推荐(0)
摘要: 这段代码的核心目标是高效、安全地将预训练好的大模型权重从硬盘加载到内存(或指定的计算设备)中,并正确地赋值给 nn.Module 模型实例的各个参数。vLLM 是一个为大语言模型(LLM)推理设计的、非常高效的库,因此它的权重加载逻辑也经过了特殊优化,以处理模型并行、量化等复杂情况。 下面我们将逐行 阅读全文
posted @ 2025-06-19 16:41 jack-chen666 阅读(287) 评论(0) 推荐(0)
摘要: safetensor 权重文件的加载 详细过程 深入理解大模型 Safetensors 权重文件的加载过程 作为一名大模型算法工程师,你肯定知道权重文件对于模型的运行至关重要。传统的 PyTorch 模型权重通常保存为 .bin 或 .pth 格式,这些格式在加载时存在一些安全隐患和效率问题。而 S 阅读全文
posted @ 2025-06-19 00:10 jack-chen666 阅读(590) 评论(0) 推荐(0)
摘要: BitVLA:首个面向机器人操作的1-bit VLA模型 https://mp.weixin.qq.com/s/WBETJE1DavXKUZCu3GxDbg BridgeVLA:基于视觉 - 语言模型的输入 - 输出对齐高效 3D 操作学习(字节最新) https://mp.weixin.qq.co 阅读全文
posted @ 2025-06-15 16:54 jack-chen666 阅读(76) 评论(0) 推荐(0)
摘要: 目录ros2命令RVIZ2数据可视化调试小工具RQT时光记录仪之ros2 bag仿真工具-Gazebo ros2命令 Commands: action Various action related sub-commands bag Various rosbag related sub-command 阅读全文
posted @ 2025-06-12 12:02 jack-chen666 阅读(92) 评论(0) 推荐(0)
摘要: 目录1. launch工具launch 修改与添加参数 1. launch工具 一个机器人系统,往往由很多个不同功能的节点组成,启动一个机器人系统时往往需要启动多个节点,同时根据应用场景和机器人的不同,每个节点还会有不同的配置项。 如果每个节点我们都开一个新终端,敲ros2 run指令并写一堆参数, 阅读全文
posted @ 2025-06-12 11:21 jack-chen666 阅读(266) 评论(0) 推荐(0)
上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 32 下一页