摘要: DeepSeek-R1详解 咱把这张 DeepSeek-R1 的架构图拆成几块唠,保证小白也能听懂!就当是带着大家“逛” 模型从训练到能用的 “流水线工厂”,每个模块是干啥的、数据咋流动,一一说清楚~ 一、Offline Training Pipeline(离线训练流水线) 这部分是 **“模型的产房”**,负责把 “基础模型 阅读全文
posted @ 2025-08-01 17:20 没事学AI 阅读(550) 评论(0) 推荐(3)
摘要: LangChain详解 一、LangChain 是什么 LangChain 是一个强大的框架,它能帮助开发者轻松地利用大型语言模型(LLMs)来构建各种智能应用。就好比搭积木,LangChain 把开发智能应用所需的各种功能模块都准备好了,你只要按照自己的想法把这些 “积木” 组合起来,就能搭建出独特的应用。它的官方 Gi 阅读全文
posted @ 2025-08-01 08:59 没事学AI 阅读(528) 评论(0) 推荐(0)