摘要: GOT-OCR2.0 是一个端到端的的OCR项目,它采用了多模态视觉-语言大模型架构:预训练VitDet 视觉模型+ 阿里通义千问Qwen语言模型,具有多方面优良特性。 本人环境:window11 + python3.10 + cuda12.8 成功安装了GOT-OCR2.0,期间也遇到了一些问题和 阅读全文
posted @ 2025-09-16 16:06 ttweixiao9999 阅读(72) 评论(0) 推荐(0)