导航

2024年4月24日

摘要: LLaVA(Large Language and Vision Assistant 大型语言和视觉助手 https://llava-vl.github.io/)是个多模态人工智能模型,它能同时理解和生成文本和图像内容。简单来说,这个模型就像一个可以看懂图片并且能用语言与人交流的智能助手。 LLaVA 阅读全文

posted @ 2024-04-24 15:30 蝈蝈俊 阅读(49) 评论(0) 推荐(0) 编辑