摘要: Cursor 团队最近发了一篇博客,讲的是他们怎么评测模型质量。看完很有启发,做个笔记记录一下自己的理解。周末看见了,又专门精读了几遍,我只能说Cursor NB 上面这张图是Cursor的测评结果,看见Claude Sonnet有多辣鸡了吗?以及最贵的Opus也不过如此是不是?我直接说结论:写代码 阅读全文
posted @ 2026-03-31 23:22 梦烬 阅读(60) 评论(0) 推荐(0)