摘要: Deepseek系列博客目录 Model 核心 Date DeepSeekLLM 探究LLM Scalling Law 2024.01 DeepSeekMath 提出GRPO 2024.04 DeepSeek-V2 DeepSeekMoE, Multi-Head Latent Attention ( 阅读全文
posted @ 2025-03-14 18:56 AAA建材王师傅 阅读(79) 评论(0) 推荐(0)
摘要: Deepseek系列博客目录 Model 核心 Date DeepSeekLLM 探究LLM Scalling Law 2024.01 DeepSeekMath 提出GRPO 2024.04 DeepSeek-V2 DeepSeekMoE, Multi-Head Latent Attention ( 阅读全文
posted @ 2025-03-14 18:54 AAA建材王师傅 阅读(41) 评论(0) 推荐(0)