摘要: ARC-AGI benchmark 提供了基于视觉网格的谜题,它们是“对于人类简单、对于大模型困难”的问题。 阅读全文
posted @ 2026-01-07 19:57 MoonOut 阅读(104) 评论(0) 推荐(2)