会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
AI-Frontiers 公#众#号:AI-Frontiers
分享AI前沿进展、底层原理和行业应用
博客园
首页
新随笔
联系
订阅
管理
2025年11月7日
Huggingface 214页训练手册:揭秘构建世界级大语言模型的秘密
摘要: 《The Smol Training Playbook: The Secrets to Building World-Class LLMs》由 Hugging Face 团队于 2025 年 10 月 30 日发布,详情见https://huggingface.co/spaces/HuggingFa
阅读全文
posted @ 2025-11-07 08:43 AI-Frontiers
阅读(123)
评论(0)
推荐(1)
2025年11月3日
收藏!强化学习从入门到封神:5 本经典教材 + 8 大实战项目 + 7个免费视频,一站式搞定
摘要: 原文:https://mp.weixin.qq.com/s/nfN0dWT3ZfDuW7ZGfaG6dA 学习资源 经典教材 《大模型算法:强化学习、微调与对齐》 原创 100+ 架构图,系统讲解大模型、强化学习,涵盖:LLM / VLM 等大模型原理、训练算法(RL、RLHF、GRPO、DPO、S
阅读全文
posted @ 2025-11-03 22:01 AI-Frontiers
阅读(93)
评论(0)
推荐(0)
2025年10月30日
小白也能看懂的RL-PPO
摘要: 原文链接:https://mp.weixin.qq.com/s/cx3qY42Lp0L3RaSOgsH77A 1. 强化学习基本概念 强化学习(Reinforcement Learning, RL)作为机器学习的重要分支,目标是让智能体(agent)与环境(environment)不断交互,学习任意
阅读全文
posted @ 2025-10-30 22:20 AI-Frontiers
阅读(7)
评论(0)
推荐(0)
公告