2025 年 2月 5 日随笔档案 - 蝈蝈俊

2025年2月5日

当AI变“聪明”了，提问的姿势也要变！

摘要：自从用上 DeepSeek_R1 这样的“聪明”AI，是不是感觉效率飞升，但这同时也带来了一个“甜蜜的烦恼”：以前那种“指哪打哪”的简单指令，有时候好像不太灵了！就像面对更聪明的员工，你不能再像指挥小学生一样，得换个沟通方式，才能更好地合作，让他们发挥出真正的实力。难道AI“翅膀硬了”，开始“ 阅读全文

posted @ 2025-02-05 16:41 蝈蝈俊阅读(318) 评论(0) 推荐(0)

解读 DeepSeek-R1-Zero 和 DeepSeek-R1 的前世今生，以及它们背后的强化学习

摘要： DeepSeek 发布的推理模型 DeepSeek-R1不仅在多项推理基准测试中比肩 OpenAI 顶级模型 o1-1217，更令人惊叹的是，它的背后，是纯粹的强化学习 (RL) 路线！ DeepSeek 研究员 Daya Guo 的 “新年寄语”：见证大规模 RL 的魔力 DeepSeek 的核阅读全文

posted @ 2025-02-05 13:51 蝈蝈俊阅读(5474) 评论(0) 推荐(2)

蝈蝈俊的技术心得

导航

公告

当AI变“聪明”了，提问的姿势也要变！

解读 DeepSeek-R1-Zero 和 DeepSeek-R1 的前世今生，以及它们背后的强化学习