2025 年 2月 4 日随笔档案 - 白鹿原老张

2025年2月4日

摘要：原作：阿尔贝托·罗梅罗与 o1 相比，R1 的表现如何？ DeepSeek 在六个相关基准（如 GPQA Diamond 和 SWE-bench Verified）以及其他替代测试（如 Codeforces 和 AIME）上对 R1 和 o1 进行了一对一比较。列表中遗漏了 ARC-AGI 和 F 阅读全文

posted @ 2025-02-04 13:39 白鹿原老张阅读(709) 评论(0) 推荐(0)

好好学习，天天向上

读无字之书,品惊人妙句,会难通之解,参最上禅机