览
新生国产模型
- Mureka:昆仑万维搞出来的,纯野鸡,去年4月份就在B站有人宣发,到现在一直不温不火,这已经足以说明问题了;最新 V9 大家评测出来依然只有 Suno V4 的水平。
- Minimax:没你的事玩去吧()它专注的是语音合成,效果实测非常好,到音乐上就是中文的人声“自然流畅、咬字准确”是胜过 suno 的。
华为音悦家
这东西真王朝了,我昨晚看到消息是老泪纵横,晚上一点钟睡不着觉。
不放图,要预览上 B 站找视频,或者直接入手 Mate Pad。
-
我断言:音悦家会爆杀 Garage Band,成为 大众市场下 国人 移动端编曲 入门 的最优选。你不要盯着这一堆限定词不放,我就问你:这是不是我们日常生活中接触到的绝大部分场景?这个应用需求在以前是不是只有库乐队在做?这个用户群体,在我们看不见的地方,是不是非常庞大?
-
进一步给出对比定位。HarmonyOS 要实现对 VST3 的支持还要跨越一道很宽的技术鸿沟,但我认为这本身就没有必要——无论你是快速建构四大件、探索民乐音色的初阶编曲人,还是没法碰 pc 需要快速记录灵感的学生,你都几乎没有使用外源乐器的必要。隔壁库乐队的 VST 接口也没多少人在使用,何况移动端 ios 的文件管理还是公认的傻逼。
作为平板上的东西,有些人拿它跟 logic 比较然后指出诸多不足云云,那我寻思你咋不跟 FL Cubase StudioOne 去比呢😓我们的愿景是:用户拿到华子的产品,打开发现有这么一个原生软件,然后跟着教程随手就开始做自己的第一首歌。很多人对“下沉市场”戴有色眼镜,这是毫无根据的。Fun Fact:很多人买苹果,本身就是为了库乐队。
-
说回正题。音悦家的 UI 非常友好,有 Kontakt 式的乐器建模界面、AbletonLive 式的下方效果器展示、以及它本身照搬的 GarageBand 式的轨道视图等等,上手很舒服。
-
整体的开发是上海音乐学院音乐工程系的师生辅助完成的。两点好处:1. 自带一套乐理入门教程,直接指向操作面板;2. daw 的常规功能和 midi 编辑方法是一应俱全。我不禁开始反思:央音在找清华合作 AI,上音在找华子做软件,那你星海在干什么😭
-
第一个直接集成 AI 功能的移动端 daw。可用:音轨分离(云算)、单轨生成(“智能乐手”,本地算)、AI 乐器(跟 AceStudio 差不多)。单轨生成是直接给 midi 的,并且一次能出来十几二十个给你挑,相当强大。
-
有人扒过,鸿蒙采用类似 mac 的 CoreAudio 音频架构,这意味着它对外源的免驱声卡有天然支持。
-
音悦家自带的民乐音色库前所未有地、史诗级地、具有开创意义地、颠覆性地,庞大。\(50\%\) 以上的乐器,目前市面上没有厂家做出过音源;甚至有部分乐器连我都没听说过是啥,据华为自己所说,是“博物馆里挖出来的、一点一点分层精细采样录制得到的”。一个大众化软件的民乐音色规模和所有的现代 + 西洋乐器加起来平起平坐,不敢想象它会对市场生态带来怎样翻天覆地的变化。
周三才看到这样的句子:“我们不缺好故事,缺的是把故事讲给大众听的载体”。好的文化必须要让人触手可及、自发地用它的语言去表达,才能不致断流。如果当代音乐人想要碰到民乐必须按照 ample 的指引、对着那个死妈 ilok 激活倒腾八百年,那么民乐依然活在象牙塔里。
华为做这个音悦家,不是想让它成为专业制作人的主力 DAW、甚至不是想让它本身形成商业闭环,而是想让它和《天生会画》等 app 一起,构建起一个类似苹果的原生软件群,提升机子的附加值。你问为什么不早点入场?要不看看 21 年那会华子忙着在干什么呢……芯片的问题华为倾全公司之力在推动;音源塑料的问题,以华为的财力、加上类似 ample 这类前辈的技术支持,不可能构成卡脖子。所以我们绝对愿意相信音悦家的前景。
当然,如果把视野扩大到 HarmonyOS 的整个开发者生态,那还是任重而道远。
自制 DAW
现在似乎成了一种潮流。你就说这玩意强不强悍吧;也是这周的事情,我还刷到了一个群友的项目,主打 LLM Agent 语言交互编辑,虽然有人指出这还不如直接生成音乐的模型,但也是一种可探索的方向。Btw,宣发一下我跟着 2 班技术大佬搞的开源项目,是类似思路的 Agent 辅助创作。记得右上角点个 Star
我们说,这其实不构成一种技术趋势;这个“潮流”完全是 Vibe-Coding 大行其道的结果,个人开发者完成整个项目的时间周期和技术成本大幅下降。上面那个视频的评论区也有人指出,有才如此干什么事情不好,非得倒腾一个从根本上就受限的网页版 DAW(html 要写一个类似 asio 的接口才能支持 VST)😂
Ace-step 本地部署
这不是什么新东西,只不过我一直没时间看。这玩意要吃透是很难的,我 8 月份之内打算把它的工作流弄清楚(Comfy UI + Prompt Design + LoRA Training),然后考虑有没有什么可优化的地方写一下(开源,这就是为什么它相比 Suno 来讲搞的人多很多)。
我曾公开提出暴论“配乐领域 AI 无法达到人类水准”,不攻自破。再强调一遍核心指引:我四个月前已经确定下的、保持不变的想法是,当今时代最需要有人去把人类的需求转化为 AI 可理解的架构模式——写代码是如此(项目结构 / 接口调用),做音乐亦是如此(配器想法 / 风格要求)。
和弦分析
我一直用的是 Audio Jam,最近拆一首 Blues 出问题了。于是我重新查找,发现现在仍然是老牌的 Chord ai 和 Chordify 在不断更新优化,不过很操蛋的一点是两者都只支持 ios。
先说明:以现在的技术背景,在绝大多数场景下各个工具都是可以胜任和弦分析的;出现差异的地方仅限于“不规范”的编曲或者未经完整混音母带处理的片段。简单来说,Audio Jam 倾向于把多个和弦合并为一个;而 Chord ai 对同一段音乐测试结果为

也就是切换和弦的频率问题,你用什么工具取决于你是想要快速把握和声脉络 还是精细分析扩展音建构。其实一般是多参考几个工具。
你会发现我们一直把 Suno 当作一个参照物。它确实代表了全球最顶尖的水准,目前看不到任何其他模型超越它的希望。对于创作者而言,所有的商业化运用目前一律看准 Suno;对于开发者而言,我们想要达成的是一种万物竞发的态势,以国内现在的技术迭代速度来看,未来如何犹未可知。

浙公网安备 33010602011771号