Ultimate Vocal Remover一款开源的 AI 音频分离工具

　　Ultimate Vocal Remover（简称 UVR）是一款开源的 AI 音频分离工具，主要用于从歌曲中提取或去除人声，也支持分离鼓点、贝斯、吉他等音轨。

开源免费：基于 Python 和 PyTorch 开发，社区驱动
AI 模型驱动：使用 Demucs、MDX-Net、VR Architecture 等深度学习模型
功能：人声去除/提取、乐器分离、混响消除、回声去除等
跨平台：支持 Windows、macOS 和 Linux
去除录音中的噪音或背景音乐

一. 下载地址:

GitHub 官方仓库:https://github.com/Anjok07/ultimatevocalremovergui

　　下载后大概1~2GB，最好有显卡，运行模型会更快一点

　　安装好后如下:

二. 简单介绍

1. 顶部标题 & 标识

Ultimate Vocal Remover/ UVR5：软件名称，全称“终极人声移除器”，版本 v5.6.0。

2. 输入/输出路径（文件选择）

Select Input：选择输入文件（音频/视频，软件会自动提取音频轨道处理）。
- 用途：指定需要处理的原始文件（如视频 video4.mp4、音频 song.wav等）。
Select Output：选择输出目录。
- 用途：指定处理后文件的保存位置（如 output3文件夹）。
右侧文件夹图标：点击可打开文件浏览器，快速选择输入文件/输出目录。

3. 输出格式（`WAV`/ `FLAC`/ `MP3`）

WAV：无损音频格式，音质最好但体积大。
FLAC：无损压缩格式，体积比WAV小，音质无损。
MP3：有损压缩格式，体积小、兼容性强，但音质有损失（默认选中，平衡体积和兼容性）。

4. 处理核心参数

（1）`CHOOSE PROCESS METHOD`（选择处理方法）

选项：Demucs（默认，UVR5的核心分离算法，基于AI模型；也可扩展其他模型，如“MDX”等，需插件或自定义）。
用途：选择音频分离的核心算法，不同算法对“人声-伴奏”的分离精度、速度、适用场景（如复杂编曲、纯音乐）有差异。

（2）`CHOOSE STEM(S)`（选择声部）

选项：All stems（默认，分离所有声部，如“人声”“伴奏”“其他乐器”等；也可选择 Vocals Only（仅提取人声）、Instrumental Only（仅提取伴奏）、Bass Only（仅贝斯）等细分声部）。
用途：定义需要提取/分离的音频“声部”，按需选择（如只想提取伴奏，选 Instrumental Only）。

（3）`SEGMENT`（分段处理）

选项：数字（如 10），单位是秒（需结合 Sample Mode理解，见下文）。
用途：将长音频分段处理（避免长时间处理导致内存溢出、卡顿），分段后逐段分离再合并。数字越大，单段时长越长，处理速度可能稍快，但内存占用更高。

（4）`CHOOSE DEMUCS MODEL`（选择Demucs模型）

选项：如 v4 | htdemucs_ft（默认，Demucs的不同版本模型，带 _ft表示“微调版”，对特定风格（如流行、摇滚）分离更优；也有 v3、v2等模型，或针对“人声/伴奏”的专用模型）。
用途：选择Demucs的AI模型，不同模型对不同音乐类型（如古典、电音、民谣）的分离精度、速度有差异，需根据音频风格试错选择。

5. 辅助选项（复选框）

GPU Conversion：启用GPU加速（需显卡支持CUDA/OpenCL）。
- 用途：利用显卡并行计算，大幅提升处理速度（CPU处理慢，GPU加速适合长音频/多任务）。
Primary Stem Only：仅处理“主声部”（如人声是主声部时，只分离人声；伴奏是主声部时，只分离伴奏）。
- 用途：简化处理，只聚焦单一核心声部（减少输出文件数量，或加速处理）。
Secondary Stem Only：仅处理“次声部”（与主声部相对，如人声是主，次声部可能是伴奏；或反之）。
Sample Mode (30s)：采样模式（30秒），结合 SEGMENT使用（若勾选，分段时长强制为30秒？或按30秒为单位采样处理？需看软件逻辑，通常是“测试模式”或“固定分段时长”）。

6. 预设与启动

SELECT SAVED SETTINGS/ Choose Option：选择已保存的设置方案（如之前调试好“MP3+All stems+Demucs v4”的参数，保存后可一键调用，避免重复设置）。
Start Processing：开始处理（点击后，软件按当前所有参数，对输入文件进行声部分离，输出到指定目录）。

7. 底部版本信息

Ultimate Vocal Remover v5.6.0 [2026-04-22 16:26:18]：软件版本号 + 编译时间，用于确认版本和功能兼容性。

三. 简单使用提取笛声

　　初始时候，没有这个笛声提取的模型，需要去下载，如果不能连接外网，可以手动下载:

　　然后将下面模型文件下载下来:

　　如下:

　　下载完就放到该安装的目录下:

　　然后点击界面的

　　我用的cpu，也很比较快，音频比较短。最后生成目录如下；

　　其中音乐中htdemus.mp3就是单纯的笛子部分了，但还是纯度不是特别纯，但还可以。

　　小结:对开源软件Ultimate Vocal Remover做了简单的介绍及演示使用其分离出音乐中的笛子部分。

posted @ 2026-04-22 17:34 wancy 阅读(1046) 评论(0) 收藏举报

刷新页面返回顶部