摘要: 引子 2025年春节期间,阿里推出Qwen2.5-VL,开源了3B、7B、72B模型,,能够处理图像和文本的联合任务,如图像描述生成、视觉问答(VQA)、图文匹配等。。之前写了一篇Qwen2-VL的博客,感兴趣的童鞋请移步(https://blog.csdn.net/zzq1989_/article 阅读全文
posted @ 2025-04-21 09:28 要养家的程序猿 阅读(1579) 评论(0) 推荐(0)