Stay Hungry,Stay Foolish!

摘要: 多模态大模型(MLLMs)是一类结合了大型语言模型(LLMs)的自然语言处理能力与对其他模态(如视觉、音频等)数据的理解与生成能力的模型。 旨在通过整合文本、图像、声音等多种类型的输入和输出,提供更加丰富和自然的交互体验。 A Survey on Multimodal Large Language 阅读全文
posted @ 2024-09-01 20:57 lightsong 阅读(3127) 评论(0) 推荐(0)
千山鸟飞绝,万径人踪灭