2025 年 8月 14 日随笔档案 - 向着朝阳

2025年8月14日

摘要：目录1. PT（Pre-training，预训练）2. SFT（Supervised Fine-Tuning，监督微调）3. RL（Reinforcement Learning，强化学习）三阶段对比总结实际应用场景总结：sft 或者 rl 。现在 rl 很火，但是比较难搞。sft 里面的提示词工程阅读全文

posted @ 2025-08-14 13:49 向着朝阳阅读(547) 评论(0) 推荐(0)

Rocketmq半消息

摘要：目录背景和价值一、RocketMQ 半消息原理1. 核心流程（两阶段提交）2. 关键设计二、应用场景与实战1. 典型场景2. 代码实现参考资料背景和价值 RocketMQ 的半消息（Half Message）是一种用于实现分布式事务最终一致性的核心机制，通过两阶段提交（2PC）的优化变体，保障本地阅读全文

posted @ 2025-08-14 11:30 向着朝阳阅读(76) 评论(0) 推荐(0)

aibi1

公告