2025 年 8月 30 日随笔档案 - ZacksTang

2025年8月30日

摘要： 1. LLM Benchmark 随着大语言模型（LLM）的不断发展，如何系统化、客观化地对其进行评测与性能对比，已经成为研究与工业落地中不可或缺的一环。传统的模型评测往往聚焦在单一的任务或指标，而在实际应用中，LLM 的表现不仅取决于模型本身，还与推理框架、硬件环境以及参数调优方式密切相关。本文将阅读全文

posted @ 2025-08-30 23:59 ZacksTang 阅读(948) 评论(0) 推荐(0)

ZacksTang

公告