直接load Qwen2_5OmniThinkerForConditionalGeneration进行推理时eos token失灵的问题,导致不断生成重复token直至max new tokens触发
摘要:
https://github.com/QwenLM/Qwen2.5-Omni/issues/371 遇到标题里描述的问题,最终的解决方法是:在调用 generate 函数时,显式地重新设置 eos_token_id 和 pad_token_id。代码示例如下: text_ids = model.ge 阅读全文
posted @ 2025-11-26 00:09
Texley
阅读(7)
评论(0)
推荐(0)

浙公网安备 33010602011771号