摘要:
昨天,我们还在欢呼:“LLAMA-4 支持 1M-10M 的超长上下文!以后一本书塞进去,直接问细节,岂不是无敌?” 今天,Fiction.LiveBench 的评测结果狠狠打脸 Llama-4 在 1K token 上下文时,召回率(近似回答正确率)就已经掉到 60% 以下, 而 Llama-4- 阅读全文
posted @ 2025-04-07 14:02 蝈蝈俊 阅读(158) 评论(0) 推荐(0)
|
|
|
|
摘要:
昨天,我们还在欢呼:“LLAMA-4 支持 1M-10M 的超长上下文!以后一本书塞进去,直接问细节,岂不是无敌?” 今天,Fiction.LiveBench 的评测结果狠狠打脸 Llama-4 在 1K token 上下文时,召回率(近似回答正确率)就已经掉到 60% 以下, 而 Llama-4- 阅读全文
posted @ 2025-04-07 14:02 蝈蝈俊 阅读(158) 评论(0) 推荐(0) |
|