G
N
I
D
A
O
L
摘要: 任务来源:Datawhale AI 学习中心「〖Day1-2〗15分钟部署&运行 Gemma4 大模型,撰写学习笔记」 学习目标:理解大模型本地部署的基本流程,并能够使用 vLLM 启动 Gemma 4 模型服务,完成一次本地对话测试。 1. 大模型是什么? 大语言模型(LLM)的核心可以理解为:根 阅读全文
posted @ 2026-06-12 23:59 盲仔你要沉住气 阅读(8) 评论(0) 推荐(0)
摘要: BPE分词算法 步骤: 初始化词汇表v 找到共同出现次数最多的x、x',执行步骤3,直到达到停止的要求或者没有共同出现的x、x' 将找到x、x'替换为xx'到v中 阅读全文
posted @ 2025-12-15 21:12 盲仔你要沉住气 阅读(13) 评论(0) 推荐(0)
摘要: 卷积核需要走\(n-k\)格到达终点。 假设步长为\(s\),需要\(\frac{n-k}{s}\)步到达终点,还需要加上卷积核起始位置\(+1\),即现在为\(\frac{n-k}{s}+1\)。 如果加上填充\(p\),则输出的形状位\(\frac{n-k+p}{s}+1\) 阅读全文
posted @ 2025-11-07 09:49 盲仔你要沉住气 阅读(13) 评论(0) 推荐(0)
摘要: sigmoid函数求导 阅读全文
posted @ 2025-11-01 21:00 盲仔你要沉住气 阅读(5) 评论(0) 推荐(0)