m516606428

2025年6月15日

摘要：以下是结合大模型与 NLP 场景的强化学习面试题整理，涵盖基础概念、技术应用及算法原理，附核心要点解析：一、强化学习基础概念什么是强化学习？与监督学习、无监督学习的核心区别？核心定义：通过智能体与环境交互，以最大化累积奖励为目标的学习范式，强调 “试错” 与 “延迟奖励”。区别：监督学习依阅读全文

posted @ 2025-06-15 12:25 m516606428 阅读(138) 评论(0) 推荐(0)

大模型和nlp面试题

摘要：大模型基础目前主流的开源模型体系有哪些？涌现能力是啥原因？大模型 LLM 的架构是怎样的？目前比较受欢迎的开源大模型有哪些？ prefix LM 和 causal LM、encoder - decoder 区别及各自有什么优缺点？模型幻觉是什么，如何解决？大模型的 Tokenizer 的阅读全文

posted @ 2025-06-15 11:38 m516606428 阅读(29) 评论(0) 推荐(0)

公告