摘要:
Deepseek系列博客目录 Model 核心 Date DeepSeekLLM 探究LLM Scalling Law 2024.01 DeepSeekMath 提出GRPO 2024.04 DeepSeek-V2 DeepSeekMoE, Multi-Head Latent Attention ( 阅读全文
posted @ 2025-03-14 18:56
AAA建材王师傅
阅读(79)
评论(0)
推荐(0)
摘要:
Deepseek系列博客目录 Model 核心 Date DeepSeekLLM 探究LLM Scalling Law 2024.01 DeepSeekMath 提出GRPO 2024.04 DeepSeek-V2 DeepSeekMoE, Multi-Head Latent Attention ( 阅读全文
posted @ 2025-03-14 18:54
AAA建材王师傅
阅读(41)
评论(0)
推荐(0)

浙公网安备 33010602011771号