Ultimate Vocal Remover一款开源的 AI 音频分离工具

  Ultimate Vocal Remover(简称 UVR)是一款开源的 AI 音频分离工具,主要用于从歌曲中提取或去除人声,也支持分离鼓点、贝斯、吉他等音轨。

  • 开源免费:基于 Python 和 PyTorch 开发,社区驱动
  • AI 模型驱动:使用 Demucs、MDX-Net、VR Architecture 等深度学习模型
  • 功能:人声去除/提取、乐器分离、混响消除、回声去除等
  • 跨平台:支持 Windows、macOS 和 Linux
  • 去除录音中的噪音或背景音乐

一. 下载地址:

GitHub 官方仓库:https://github.com/Anjok07/ultimatevocalremovergui

  下载后大概1~2GB,最好有显卡,运行模型会更快一点

image

  安装好后如下:

image

 

二. 简单介绍

1. 顶部标题 & 标识

  • Ultimate Vocal Remover/ UVR5:软件名称,全称“终极人声移除器”,版本 v5.6.0

2. 输入/输出路径(文件选择)

  • Select Input选择输入文件(音频/视频,软件会自动提取音频轨道处理)。
    • 用途:指定需要处理的原始文件(如视频 video4.mp4、音频 song.wav等)。
  • Select Output选择输出目录
    • 用途:指定处理后文件的保存位置(如 output3文件夹)。
  • 右侧文件夹图标:点击可打开文件浏览器,快速选择输入文件/输出目录。

3. 输出格式(WAV/ FLAC/ MP3

  • WAV:无损音频格式,音质最好但体积大。
  • FLAC:无损压缩格式,体积比WAV小,音质无损。
  • MP3:有损压缩格式,体积小、兼容性强,但音质有损失(默认选中,平衡体积和兼容性)。

4. 处理核心参数

(1)CHOOSE PROCESS METHOD(选择处理方法)

  • 选项:Demucs(默认,UVR5的核心分离算法,基于AI模型;也可扩展其他模型,如“MDX”等,需插件或自定义)。
  • 用途:选择音频分离的核心算法,不同算法对“人声-伴奏”的分离精度、速度、适用场景(如复杂编曲、纯音乐)有差异。

(2)CHOOSE STEM(S)(选择声部)

  • 选项:All stems(默认,分离所有声部,如“人声”“伴奏”“其他乐器”等;也可选择 Vocals Only(仅提取人声)、Instrumental Only(仅提取伴奏)、Bass Only(仅贝斯)等细分声部)。
  • 用途:定义需要提取/分离的音频“声部”,按需选择(如只想提取伴奏,选 Instrumental Only)。

(3)SEGMENT(分段处理)

  • 选项:数字(如 10),单位是(需结合 Sample Mode理解,见下文)。
  • 用途:将长音频分段处理(避免长时间处理导致内存溢出、卡顿),分段后逐段分离再合并。数字越大,单段时长越长,处理速度可能稍快,但内存占用更高。

(4)CHOOSE DEMUCS MODEL(选择Demucs模型)

  • 选项:如 v4 | htdemucs_ft(默认,Demucs的不同版本模型,带 _ft表示“微调版”,对特定风格(如流行、摇滚)分离更优;也有 v3v2等模型,或针对“人声/伴奏”的专用模型)。
  • 用途:选择Demucs的AI模型,不同模型对不同音乐类型(如古典、电音、民谣)的分离精度、速度有差异,需根据音频风格试错选择。

5. 辅助选项(复选框)

  • GPU Conversion启用GPU加速(需显卡支持CUDA/OpenCL)。
    • 用途:利用显卡并行计算,大幅提升处理速度(CPU处理慢,GPU加速适合长音频/多任务)。
  • Primary Stem Only仅处理“主声部”(如人声是主声部时,只分离人声;伴奏是主声部时,只分离伴奏)。
    • 用途:简化处理,只聚焦单一核心声部(减少输出文件数量,或加速处理)。
  • Secondary Stem Only仅处理“次声部”(与主声部相对,如人声是主,次声部可能是伴奏;或反之)。
  • Sample Mode (30s)采样模式(30秒),结合 SEGMENT使用(若勾选,分段时长强制为30秒?或按30秒为单位采样处理?需看软件逻辑,通常是“测试模式”或“固定分段时长”)。

6. 预设与启动

  • SELECT SAVED SETTINGS/ Choose Option选择已保存的设置方案(如之前调试好“MP3+All stems+Demucs v4”的参数,保存后可一键调用,避免重复设置)。
  • Start Processing开始处理(点击后,软件按当前所有参数,对输入文件进行声部分离,输出到指定目录)。

7. 底部版本信息

  • Ultimate Vocal Remover v5.6.0 [2026-04-22 16:26:18]:软件版本号 + 编译时间,用于确认版本和功能兼容性。

 三. 简单使用提取笛声

  初始时候,没有这个笛声提取的模型,需要去下载,如果不能连接外网,可以手动下载:

image

 

image

   然后将下面模型文件下载下来:

image

 

   如下:

image

  下载完就放到该安装的目录下:

image

   然后点击界面的

image

   我用的cpu,也很比较快,音频比较短。最后生成目录如下;

image

  其中音乐中htdemus.mp3就是单纯的笛子部分了,但还是纯度不是特别纯,但还可以。

 

 

 

 

  小结:对开源软件Ultimate Vocal Remover做了简单的介绍及演示使用其分离出音乐中的笛子部分。

 

posted @ 2026-04-22 17:34  wancy  阅读(232)  评论(0)    收藏  举报