导航

2025年2月5日

摘要: 自从用上 DeepSeek_R1 这样的“聪明”AI,是不是感觉效率飞升,但这同时也带来了一个“甜蜜的烦恼”: 以前那种“指哪打哪”的简单指令,有时候好像不太灵了! 就像面对更聪明的员工,你不能再像指挥小学生一样,得换个沟通方式,才能更好地合作,让他们发挥出真正的实力。 难道AI“翅膀硬了”,开始“ 阅读全文

posted @ 2025-02-05 16:41 蝈蝈俊 阅读(272) 评论(0) 推荐(0)

摘要: DeepSeek 发布的推理模型 DeepSeek-R1不仅在多项推理基准测试中比肩 OpenAI 顶级模型 o1-1217,更令人惊叹的是,它的背后,是 纯粹的强化学习 (RL) 路线! DeepSeek 研究员 Daya Guo 的 “新年寄语”:见证大规模 RL 的魔力 DeepSeek 的核 阅读全文

posted @ 2025-02-05 13:51 蝈蝈俊 阅读(5393) 评论(0) 推荐(2)