摘要:
你给模型输入一段文字,它怎么理解你的意思?又怎么组织出回答的?整个过程分几步走:先拆成 Token(分块)→ 转成向量(数字化)→ 算相关性(注意力)→ 逐字往外蹦(预测)。每一步对应一个核心概念,这篇把它们串起来。不写代码,不讲公式,讲给非技术的同事能听懂。 阅读全文
你给模型输入一段文字,它怎么理解你的意思?又怎么组织出回答的?整个过程分几步走:先拆成 Token(分块)→ 转成向量(数字化)→ 算相关性(注意力)→ 逐字往外蹦(预测)。每一步对应一个核心概念,这篇把它们串起来。不写代码,不讲公式,讲给非技术的同事能听懂。 阅读全文
posted @ 2026-05-26 15:56
龙骑士baby
阅读(7)
评论(0)
推荐(0)

AI > ML > DL > NLP/LLM > GenAI 是套娃结构,不是并列关系。大模型本质就是"140GB 参数文件 + 推理代码"。训练一个 70B 模型需要 6000 张 GPU 跑 12 天、花费约 200 万美元。LLM 能生成内容、总结、翻译,但会编造事实、数学不精确、知识不实时。全产业链从能源芯片到应用层共六层。读完本文你就能把任何一个 AI 术语放在地图的对应位置。
两年 AI 实践后决定从头搭建认知体系。六层递进框架:基础认知 → 核心原理 → 关键范式 → 系统架构 → 产品策略 → 项目实践。面向同样在转型路上、学了碎片但说不透的人。
浙公网安备 33010602011771号