Ultimate Vocal Remover一款开源的 AI 音频分离工具
Ultimate Vocal Remover(简称 UVR)是一款开源的 AI 音频分离工具,主要用于从歌曲中提取或去除人声,也支持分离鼓点、贝斯、吉他等音轨。
-
开源免费:基于 Python 和 PyTorch 开发,社区驱动
-
AI 模型驱动:使用 Demucs、MDX-Net、VR Architecture 等深度学习模型
-
功能:人声去除/提取、乐器分离、混响消除、回声去除等
-
跨平台:支持 Windows、macOS 和 Linux
- 去除录音中的噪音或背景音乐
一. 下载地址:
GitHub 官方仓库:https://github.com/Anjok07/ultimatevocalremovergui
下载后大概1~2GB,最好有显卡,运行模型会更快一点

安装好后如下:

二. 简单介绍
1. 顶部标题 & 标识
-
Ultimate Vocal Remover/UVR5:软件名称,全称“终极人声移除器”,版本v5.6.0。
2. 输入/输出路径(文件选择)
-
Select Input:选择输入文件(音频/视频,软件会自动提取音频轨道处理)。-
用途:指定需要处理的原始文件(如视频
video4.mp4、音频song.wav等)。
-
-
Select Output:选择输出目录。-
用途:指定处理后文件的保存位置(如
output3文件夹)。
-
-
右侧文件夹图标:点击可打开文件浏览器,快速选择输入文件/输出目录。
3. 输出格式(WAV/ FLAC/ MP3)
-
WAV:无损音频格式,音质最好但体积大。 -
FLAC:无损压缩格式,体积比WAV小,音质无损。 -
MP3:有损压缩格式,体积小、兼容性强,但音质有损失(默认选中,平衡体积和兼容性)。
4. 处理核心参数
(1)CHOOSE PROCESS METHOD(选择处理方法)
-
选项:
Demucs(默认,UVR5的核心分离算法,基于AI模型;也可扩展其他模型,如“MDX”等,需插件或自定义)。 -
用途:选择音频分离的核心算法,不同算法对“人声-伴奏”的分离精度、速度、适用场景(如复杂编曲、纯音乐)有差异。
(2)CHOOSE STEM(S)(选择声部)
-
选项:
All stems(默认,分离所有声部,如“人声”“伴奏”“其他乐器”等;也可选择Vocals Only(仅提取人声)、Instrumental Only(仅提取伴奏)、Bass Only(仅贝斯)等细分声部)。 -
用途:定义需要提取/分离的音频“声部”,按需选择(如只想提取伴奏,选
Instrumental Only)。
(3)SEGMENT(分段处理)
-
选项:数字(如
10),单位是秒(需结合Sample Mode理解,见下文)。 -
用途:将长音频分段处理(避免长时间处理导致内存溢出、卡顿),分段后逐段分离再合并。数字越大,单段时长越长,处理速度可能稍快,但内存占用更高。
(4)CHOOSE DEMUCS MODEL(选择Demucs模型)
-
选项:如
v4 | htdemucs_ft(默认,Demucs的不同版本模型,带_ft表示“微调版”,对特定风格(如流行、摇滚)分离更优;也有v3、v2等模型,或针对“人声/伴奏”的专用模型)。 -
用途:选择Demucs的AI模型,不同模型对不同音乐类型(如古典、电音、民谣)的分离精度、速度有差异,需根据音频风格试错选择。
5. 辅助选项(复选框)
-
GPU Conversion:启用GPU加速(需显卡支持CUDA/OpenCL)。-
用途:利用显卡并行计算,大幅提升处理速度(CPU处理慢,GPU加速适合长音频/多任务)。
-
-
Primary Stem Only:仅处理“主声部”(如人声是主声部时,只分离人声;伴奏是主声部时,只分离伴奏)。-
用途:简化处理,只聚焦单一核心声部(减少输出文件数量,或加速处理)。
-
-
Secondary Stem Only:仅处理“次声部”(与主声部相对,如人声是主,次声部可能是伴奏;或反之)。 -
Sample Mode (30s):采样模式(30秒),结合SEGMENT使用(若勾选,分段时长强制为30秒?或按30秒为单位采样处理?需看软件逻辑,通常是“测试模式”或“固定分段时长”)。
6. 预设与启动
-
SELECT SAVED SETTINGS/Choose Option:选择已保存的设置方案(如之前调试好“MP3+All stems+Demucs v4”的参数,保存后可一键调用,避免重复设置)。 -
Start Processing:开始处理(点击后,软件按当前所有参数,对输入文件进行声部分离,输出到指定目录)。
7. 底部版本信息
-
Ultimate Vocal Remover v5.6.0 [2026-04-22 16:26:18]:软件版本号 + 编译时间,用于确认版本和功能兼容性。
三. 简单使用提取笛声
初始时候,没有这个笛声提取的模型,需要去下载,如果不能连接外网,可以手动下载:


然后将下面模型文件下载下来:

如下:

下载完就放到该安装的目录下:

然后点击界面的

我用的cpu,也很比较快,音频比较短。最后生成目录如下;

其中音乐中htdemus.mp3就是单纯的笛子部分了,但还是纯度不是特别纯,但还可以。
小结:对开源软件Ultimate Vocal Remover做了简单的介绍及演示使用其分离出音乐中的笛子部分。

浙公网安备 33010602011771号