InstructGPT 论文略读:三步走,让大模型真正听懂人话
posted @ 2025-10-06 09:47 GRITJW 阅读(186) 评论(0) 推荐(0)
2025年10月6日 #
posted @ 2025-10-06 09:47 GRITJW 阅读(186) 评论(0) 推荐(0)
2025年10月4日 #
posted @ 2025-10-04 14:26 GRITJW 阅读(356) 评论(0) 推荐(0)
2025年10月3日 #
posted @ 2025-10-03 13:43 GRITJW 阅读(232) 评论(0) 推荐(0)
2025年9月29日 #
posted @ 2025-09-29 10:25 GRITJW 阅读(236) 评论(0) 推荐(0)
2025年9月25日 #
posted @ 2025-09-25 10:52 GRITJW 阅读(272) 评论(0) 推荐(0)
2025年9月24日 #
posted @ 2025-09-24 17:57 GRITJW 阅读(163) 评论(0) 推荐(0)
2025年9月19日 #
从MMoE到PLE:读懂多任务学习架构的渐进式演化 引言 在多任务学习(MTL)领域,MMoE(Multi-gate Mixture-of-Experts)无疑是一个里程碑式的模型,它通过巧妙的软参数共享机制,极大地提升了工业界推荐、广告等系统的多目标优化能力。然而,在面对任务间关系愈发复杂、甚至相 阅读全文
posted @ 2025-09-19 10:24 GRITJW 阅读(296) 评论(0) 推荐(0)
2025年9月18日 #
posted @ 2025-09-18 09:30 GRITJW 阅读(253) 评论(0) 推荐(0)
2025年9月17日 #
posted @ 2025-09-17 16:08 GRITJW 阅读(182) 评论(0) 推荐(0)
2025年9月16日 #
posted @ 2025-09-16 16:10 GRITJW 阅读(2750) 评论(0) 推荐(1)