摘要: 2024-11-08,由腾讯 AI 西雅图实验室和圣母大学联合创建的 Leopard-Instruct,数据集主要解决多张富含文本的图像在理解和推理上的挑战,为多模态大型语言模型(MLLMs)的发展提供了新的方向和高质量的训练数据。 一、研究背景: 在现实世界的应用中,如演示文稿、扫描文档和网页快照 阅读全文
posted @ 2024-11-15 17:32 数据猎手小k 阅读(32) 评论(0) 推荐(0)