会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Syw
博客园
首页
新随笔
联系
管理
订阅
2025年11月6日
【文本模型】长文本评测标准
摘要: 面向大语言模型(LLM)的文本生成质量评估框架 作为文本大模型的评测工程师,我深知长文本生成(通常指500词以上或连续多段落的输出)是当前大模型能力的关键挑战点。与短文本不同,长文本更易暴露模型的上下文保持能力、逻辑连贯性、错误累积风险等深层问题。错误在长文本中会被放大,导致用户体验断崖式下降(例如
阅读全文
posted @ 2025-11-06 14:22 Syw_文
阅读(60)
评论(0)
推荐(0)
公告