摘要: 引言:多模态对话幻觉的挑战 在人工智能领域,开发能够通过视觉和语言等多种渠道与人类互动的通用助手是一个重要问题。受到大型语言模型(LLMs)如ChatGPT的显著成功的启发,研究社区对开发能够支持视觉-语言指令的多模态助手,即大型多模态模型(LMMs),表现出了越来越浓厚的兴趣。这些模型在各种多模态 阅读全文
posted @ 2024-03-22 14:38 柏企 阅读(239) 评论(0) 推荐(0)
摘要: 引言:探索音乐驱动的长时舞蹈生成 在数字娱乐和虚拟现实的时代,音乐驱动的舞蹈生成技术正变得日益重要。从电影制作到游戏开发,再到为舞蹈设计师提供灵感和提高生产力,高质量且多样化的3D舞蹈动作自动生成解决方案的需求不断增长。尽管近年来生成性AI技术取得了飞速发展,现有的方法已经能够生成几秒钟的舞蹈,但现 阅读全文
posted @ 2024-03-22 13:59 柏企 阅读(319) 评论(0) 推荐(0)