上一页 1 ··· 20 21 22 23 24
摘要: 以下是结合大模型与 NLP 场景的强化学习面试题整理,涵盖基础概念、技术应用及算法原理,附核心要点解析: 一、强化学习基础概念 什么是强化学习?与监督学习、无监督学习的核心区别? 核心定义:通过智能体与环境交互,以最大化累积奖励为目标的学习范式,强调 “试错” 与 “延迟奖励”。 区别: 监督学习依 阅读全文
posted @ 2025-06-15 12:25 m516606428 阅读(138) 评论(0) 推荐(0)
摘要: 大模型基础 目前主流的开源模型体系有哪些? 涌现能力是啥原因? 大模型 LLM 的架构是怎样的? 目前比较受欢迎的开源大模型有哪些? prefix LM 和 causal LM、encoder - decoder 区别及各自有什么优缺点? 模型幻觉是什么,如何解决? 大模型的 Tokenizer 的 阅读全文
posted @ 2025-06-15 11:38 m516606428 阅读(29) 评论(0) 推荐(0)
上一页 1 ··· 20 21 22 23 24