摘要: 目录1. PT(Pre-training,预训练)2. SFT(Supervised Fine-Tuning,监督微调)3. RL(Reinforcement Learning,强化学习)三阶段对比总结实际应用场景 总结:sft 或者 rl 。现在 rl 很火,但是比较难搞。sft 里面的提示词工程 阅读全文
posted @ 2025-08-14 13:49 向着朝阳 阅读(404) 评论(0) 推荐(0)
摘要: 目录背景和价值一、RocketMQ 半消息原理1. 核心流程(两阶段提交)2. 关键设计二、应用场景与实战1. 典型场景2. 代码实现参考资料 背景和价值 RocketMQ 的半消息(Half Message)是一种用于实现分布式事务最终一致性的核心机制,通过两阶段提交(2PC)的优化变体,保障本地 阅读全文
posted @ 2025-08-14 11:30 向着朝阳 阅读(65) 评论(0) 推荐(0)