全球首款音乐推理模型Mureka O1亮相,AI音乐迎来变革
在AI技术飞速发展的当下,音乐创作领域也迎来了重大突破。昆仑万维发布的全球首款音乐推理大模型Mureka O1,引发了行业的广泛关注,这一创新成果让AI音乐迈入了新的阶段。
更多AI好文请关注【程序员导航】公众号或访问:https://www.panziye.com/ai
Mureka O1的出现,打破了AI音乐市场的原有格局。它一举超越Suno等同类模型,在各大评测中表现优异,成功登顶。该模型之所以如此强大,关键在于融入了思维链(CoT)技术。这项技术就像是给模型赋予了“思考”能力,让它在生成音乐前,能像人一样进行多步骤推理和自我检查,进而提升了歌词与旋律的契合度、演唱准确性以及艺术表现力 。
Mureka O1并非凭空诞生,它基于全新的基座模型Mureka V6进行升级。Mureka V6引入了上下文学习(ICL)技术,优化了声场效果,使人声和混音更加出色。同时,它还支持10种语言的音乐创作,覆盖了全球主要国家和地区的用户,为音乐创作提供了更多可能。
Mureka O1背后的核心技术是MusiCoT框架,这是CoT技术在音乐领域的首次应用,具有开创性意义。以往的音乐生成模型,在创作时可能缺乏系统性,而MusiCoT框架改变了这一现状。它会先从整体规划音乐结构,比如确定主歌、副歌和过渡段的大致框架,再逐步填充音频细节,就像搭建一座房子,先有框架,再进行内部装修。
而且,MusiCoT框架是基于CLAP模型构建的,不需要大量人工标注就能不断扩展功能。这使得生成的音乐不仅更具解释性,还能提升艺术感染力。用户只要输入简单的场景描述,Mureka O1就能在几秒内创作出专业水准的音乐作品,并且还支持多轨输出,方便用户进行混音和二次创作。
为了推动AI音乐的发展,Mureka向企业和开发者开放了丰富的API服务。
- 音乐API:
- 标准音乐生成API:支持多种输入方式,如文本提示、音色参考和音频参考。通过这些不同的输入,用户可以创作出各种风格的音乐,无论是用于内容创作、游戏配乐,还是短视频制作,都非常方便。
- 精调私有曲库API:用户可以上传自己的曲库,模型会根据这些曲库的风格特点进行调整,帮助用户打造专属的品牌音乐或个人专辑,即使没有专业音乐知识也能轻松操作。
- 语音API:Mureka提供了AI语音播客、精品说话人、音色克隆等功能的API。其开发的Mureka TTS在与ElevenLabs、OpenAI、微软等的评测中表现出色,在聊天对话场景下的语音合成效果与一线厂商相当。
此外,Mureka还是全球首个开放模型微调的AI音乐平台,开发者可以上传私有数据训练专属模型,并且数据会严格保密,保障了用户的权益
AI音乐市场正呈现出爆发式增长的态势。据Fortune Business Insights数据,2023年全球数字音频工作站(DAW)市场规模约为30亿美元,预计到2026年,70%的DAW企业将借助AI技术辅助音乐创作。GlobeNewswire也预测,到2032年全球DAW市场规模将超过66.2亿美元,2024年 - 2032年的复合年增长率达8.6%。
昆仑万维凭借敏锐的市场洞察力,以“All in AGI与AIGC”战略布局AI音乐领域。Mureka作为其中的关键一环,商业化前景十分广阔。此前昆仑万维推出的K歌产品Star Maker在海外取得了巨大成功,注册用户突破3.1亿。基于内容和娱乐赛道的特点,用户对AI输出的接受度较高,Mureka有望在全球范围内吸引大量用户,创造可观的收入。
Mureka O1的出现,为AI音乐带来了新的发展方向。它不仅让音乐创作变得更加高效、多样化,还为开发者和企业提供了广阔的发展空间。随着技术的不断进步,相信Mureka会在未来的音乐市场中发挥更大的作用,让更多人体验到AI音乐的魅力。