摘要: 原文: https://mp.weixin.qq.com/s/VV29xpdOMEkbz4iXmD_szg 在上一篇 RAG评测完整指南:指标、测试和最佳实践 中,我们对RAG系统中各个模块的评估方法进行系统的阐述,并没有详细介绍每个模块设计的具体指标、指标的计算方法。从本篇开始,将深入RAG系统的 阅读全文
posted @ 2025-12-22 18:55 AI-Frontiers 阅读(117) 评论(0) 推荐(0)
摘要: 原文: https://mp.weixin.qq.com/s/8O7W8--x14-b1d3M9IS_3w LLM-RL往期文章推荐 小白也能看懂的RL-PPO 收藏!强化学习从入门到封神:5 本经典教材 + 8 大实战项目 + 7个免费视频,一站式搞定 小白也能看懂的RLHF:基础篇 在上一篇小白 阅读全文
posted @ 2025-12-16 15:11 AI-Frontiers 阅读(206) 评论(0) 推荐(0)
摘要: 原文: https://mp.weixin.qq.com/s/am89yasxAvuYUToEAWNyTA RAG(Retrieval-Augmented Generation,检索增强生)最初由Facebook AI Research(现Meta AI)团队在论文 Retrieval-Augmen 阅读全文
posted @ 2025-12-01 17:48 AI-Frontiers 阅读(508) 评论(0) 推荐(0)
摘要: 原文: https://mp.weixin.qq.com/s/TQQBL1dUdxO7A9AzbmwS-A 关于本书 该书系统介绍了 AI Agent 系统的各种设计模式,涵盖从基础到高级的 21 个核心模式,以及多个附录章节。主要内容包括 提示链、路由、并行化等基础模式 反思、工具使用、规划等进阶 阅读全文
posted @ 2025-11-24 16:31 AI-Frontiers 阅读(81) 评论(0) 推荐(0)
摘要: 原文: https://mp.weixin.qq.com/s/4_6CBXMJhqmiYKSzsAXncg 人类反馈强化学习(Reinforcement Learning from Human Feedback,RLHF)是释放大语言模型(LLM)巨大潜力的关键,OpenAI在2020年发布的GPT 阅读全文
posted @ 2025-11-20 14:48 AI-Frontiers 阅读(199) 评论(0) 推荐(1)
摘要: 原文: AI编程助手:Aider使用手册(中文版) Aider 是一个终端中的 AI 结对编程工具,支持云与本地大语言模型,能为大型项目生成代码库地图以理解代码结构,兼容 100 多种编程语言,集成 Git 自动提交变更,可在 IDE 中使用,还支持图像、网页、语音交互及代码 linting 与测试 阅读全文
posted @ 2025-11-13 16:24 AI-Frontiers 阅读(242) 评论(0) 推荐(0)
摘要: 《The Smol Training Playbook: The Secrets to Building World-Class LLMs》由 Hugging Face 团队于 2025 年 10 月 30 日发布,详情见https://huggingface.co/spaces/HuggingFa 阅读全文
posted @ 2025-11-07 08:43 AI-Frontiers 阅读(547) 评论(0) 推荐(1)
摘要: 原文:https://mp.weixin.qq.com/s/nfN0dWT3ZfDuW7ZGfaG6dA 学习资源 经典教材 《大模型算法:强化学习、微调与对齐》 原创 100+ 架构图,系统讲解大模型、强化学习,涵盖:LLM / VLM 等大模型原理、训练算法(RL、RLHF、GRPO、DPO、S 阅读全文
posted @ 2025-11-03 22:01 AI-Frontiers 阅读(240) 评论(0) 推荐(0)
摘要: 原文链接:https://mp.weixin.qq.com/s/cx3qY42Lp0L3RaSOgsH77A 1. 强化学习基本概念 强化学习(Reinforcement Learning, RL)作为机器学习的重要分支,目标是让智能体(agent)与环境(environment)不断交互,学习任意 阅读全文
posted @ 2025-10-30 22:20 AI-Frontiers 阅读(27) 评论(0) 推荐(0)