Audacity-之书-全-

Audacity 之书(全)

原文:The Book of Audacity

译者:飞龙

协议:CC BY-NC-SA 4.0

简介

无标题图片

Audacity 是一个开源的、免费的、跨平台的音频录制、编辑和混音软件,适用于 Linux、Windows 和 Mac OS X。它为 Mac OS X 和所有版本的 Windows 提供了易于使用的安装程序,Linux 用户可以在他们最喜欢的 Linux 发行版的软件仓库中找到它。请访问 audacity.sourceforge.net/ 下载、文档和邮件列表。

在这本书中,我们将使用 Ubuntu Studio 和 Microsoft Windows XP、Vista 以及 Windows 7 上的 Audacity 1.3.12(及更高版本)。稳定的 2.0 版本将很快推出,应该会非常类似于本书中所示,因为 1.3.xx 系列是 2.x 的预演。本书基于最新的发布版本,因此它是最新的。1.3.xx 的 Audacity 发布版本比旧的 1.2.x 系列先进得多。每个新版本都充满了令人惊叹的改进和错误修复,所以如果你还在使用那些旧的 1.2.x 版本,你应该考虑升级。

Ubuntu Studio 是带有大量多媒体应用程序的 Ubuntu。它与 100% 的 Ubuntu 兼容,并使用标准的 Ubuntu 软件仓库。你可以下载 Ubuntu Studio 或简单地将 Ubuntu Studio 软件包和图形添加到任何 Ubuntu 安装中。有几种优秀的多媒体 Linux 发行版,你可以在 第十三章 中了解它们。你可以使用你喜欢的任何 Linux 版本;你可能需要进行的几个重要系统修改在 第十三章 中有所介绍。

Windows 也需要一些修改,你可以在 第十四章 中找到这些修改。由于 Windows XP 仍然坚持不退,拒绝退休,你将找到有关 Windows XP、Vista 和 Windows 7 的信息。

Audacity 能做什么?

Audacity 快速且易于使用。你能用它做什么?很多:

  • 与多种不同的音频文件格式和编码工作,包括 WAV、AIFF、MP3、FLAC、AU、OKI、MAT4/5、Ogg Vorbis、WMA、M4A 和 AC3。

  • 录制现场音频。

  • 将旧式的模拟媒体转换为数字格式。

  • 制作电影音轨。

  • 进行无限的多通道录音。

  • 编辑和混合多个音轨。

  • 逐层录音。

  • 使用各种特殊效果:哇音、改变音调和节奏、低音增强、回声、反转、移相器等。

  • 添加优雅的淡入淡出效果。

  • 标准化音量级别。

  • 修复如嘶嘶声、静电、爆裂声和嗡嗡声等缺陷。

  • 执行频率分析。

  • 为特殊效果编写自己的插件。

  • 剪切、复制、拼接和混合声音。

Audacity 可以比大多数其他音频应用程序更快地打开和编辑音频文件,并且具有几乎无限的撤销和重做功能。

那么,您不能用 Audacity 做什么呢?Audacity 不支持 RealAudio 格式,也不支持 MIDI。虽然它在制作单声道和立体声录音方面非常出色,但在制作多声道环绕声录音方面并不那么出色。

本书涵盖的内容

在这本书中,我们将使用 Audacity 进行多个(我希望是)有趣且实用的音频项目。在第一章中,我们将把麦克风连接到电脑上,学习录音、编辑、播放和 Audacity 控制的基本知识。我们还将学习一些重要的数字音频术语和概念。如果您是数字音频制作的新手或 Audacity 的新用户,您应该首先阅读这一章。

在第二章中,我们将详细介绍音频设备,如何选择它,如何连接它,以及如何不花太多钱。音频设备的世界既庞大又令人困惑,但这一章将为您整理一切。

如果您像我一样,有一堆珍贵的黑胶唱片、45 转速唱片或复古 78 转速唱片,您既想欣赏又想保存,请阅读第三章向您展示了如何清理和优化您的录音以适应光盘或 DVD-Audio。

第五章更详细地介绍了制作音频 CD 和混音 CD。您将学习如何标准化不同的音量级别,将长文件分割成单独的曲目,在曲目之间平滑过渡,以及编辑曲目元数据。

在第六章中,我们学习了如何制作超高品质的 DVD-Audio 光盘。DVD-Audio 是 DVD 的一种特殊音频标准;它与电影 DVD 上使用的音频格式不同。使用 DVD-Audio,您可以制作非常高品质的 DVD 或将几张 CD 的音乐加载到单个 DVD 上。

播客非常流行,第七章告诉您如何制作听起来好且带宽效率高的播客,并涵盖了互联网流媒体音频的基础知识。

第八章详细介绍了制作最高质量的音频录制以供分发,以及如何根据不同的分发类型(如网络广播、可下载格式和 CD)定制您的发布。它还提供了一些关于寻找发行商和其他商业基础的指导。

Audacity 能够有效地处理多轨录音,所以第九章展示了如何录制多个轨道、混音、配音、编辑和混音到最终的单声道、立体声或多声道环绕发布。你可以边播放边唱现有的轨道,一次录制尽可能多的轨道,只要你的录音接口支持并且你的电脑能够处理。你还可以将不同的录制会话混合在一起。

不要为铃声付费——学习第十章来了解如何轻松制作自己的铃声。铃声的大小不宜过大也不宜过小,可以是任何音乐片段或声音,甚至是你的声音。学习一些调整铃声以使其在手机的小型低音质扬声器上听起来更好的技巧。

你可以在 Audacity 中尽情尝试特殊效果——奇怪的声音、音效、回声、哇哇声、低音增强、颤音等等。第十一章向你介绍了一些插件,告诉你哪里可以获取更多,并展示如何学习编写自己的插件。

在电影和电视中,顶尖的犯罪技术专家从碎片化的音频残片中创造出详细、高质量、美丽的录音,他们在讨论他们的神奇算法时喋喋不休。这都是胡说。但你可以做很多事情来清理受爆裂声、嘶嘶声和其他缺陷影响的录音,第十二章讲述了如何做到这一点。

第十三章详细介绍了如何选择适合音频制作的 Linux 发行版,如何配置它以获得最佳性能,以及如何排除和修复常见问题。

第十四章涵盖了 Windows 用户需要进行的调整,以实现高质量的音频录制。

Audacity 易于使用,但它有一些选项可能对不是音频工程师的人来说没有意义,所以第十五章深入探讨了定制和配置。

附录 A 是你的硬件参考;你将找到在多个价格范围内工作的音频硬件示例,这些硬件在 Linux 和 Windows 上都能使用。

附录 B 是为普通人编写的音频术语表;也就是说,不是物理学家或音频工程师,并且欣赏用普通英语清晰解释的人。

附录 C 驳斥了流行的但愚蠢的音频神话,并帮助你避免一些常见且昂贵的错误。

注意

Audacity 也可以以源代码包的形式获得。源代码包有什么用?它包含 Audacity 的源代码,存储在一个压缩的归档文件中。如果你想从源代码安装 Audacity 并自定义编译选项,检查代码,修改它,甚至修改和重新分发它,都可以这样做。如果你喜欢冒险,并想帮助调试每日构建版本,你可以从并发版本系统(CVS)获取最新的 Audacity 版本,并对其进行测试。

Audacity 与 Ardour 的比较

另一个在 Linux(以及 Mac OS X)上流行的音频录制应用是 Ardour,它自称是一款数字音频工作站。Ardour 致力于满足专业人士的需求,并与 ProTools、Nuendo、Pyramix 以及其他昂贵的商业音频应用竞争。它比 Audacity 拥有更复杂的混音器,并提供一些优秀的音频视频工具。它具有高级配音能力,能与 MIDI 序列发生器同步,并支持控制表面,这些是用于控制你的软件混音器的硬件设备。它拥有更多的自动化功能,以及一些实用的实时特性,例如在运行时更改插件,以及将样本移动到不同的轨道或时间线。

哪个更好?这取决于你想做什么。两者都是 100% 的免费软件,因为它们都受 GPL 许可,两者都非常出色,而且都在不断改进。对于复杂的多轨混音或精确的视频音轨同步,选择 Ardour。对于录制长轨,如现场表演,将黑胶唱片和磁带转换为数字格式,清理因嘶嘶声、嗡嗡声或其他缺陷而损坏的文件,制作播客,制作简单的视频音轨,以及现场录音,Audacity 是一款功能强大、学习曲线短、拥有许多实用和高级功能的优秀应用。

第一章. 从头到尾的勇气

无标题图片

让我们启动 Audacity 并录制一段。我们将从快速入门教程开始,制作一个简单的录音来演示基本用法。然后我们将从开始到结束详细介绍 Audacity 的基本功能:录音、执行常见编辑任务、保存您的作品以及导出到各种音频文件格式和质量级别。

我们将在稍后处理复杂的音频硬件;目前,您只需要任何带有普通声卡的 Linux 或 Windows 计算机,以及一个带有 1/8 英寸迷你插头的麦克风或 USB 麦克风或耳机。任何麦克风都可以用于这个初始测试,即使是廉价的电脑麦克风也可以。我推荐使用外置麦克风,因为内置电脑麦克风听起来相当糟糕,而且位置不方便。当然,如果您有更好的设备并且知道如何连接,请务必使用它。

在您打开 Audacity 之前需要插入 USB 设备。如果您在 Audacity 打开时更改 USB 设备,您必须关闭并重新打开 Audacity 才能检测到更改。

Audacity 快速入门

好吧,别再摆弄了(除非你要拉小提琴)!让我们快速录制一下,因为这样比坐着读关于它的内容更有趣。图 1-1 显示了在 Windows PC 上录制前的 Audacity 新窗口。

Windows PC 上的一个新、空的 Audacity 窗口

图 1-1. Windows PC 上的一个新、空的 Audacity 窗口

图 1-2 显示了 Ubuntu Linux PC 上的一个新 Audacity 窗口。正如您所看到的,Audacity 在两个平台上几乎相同。唯一的显著差异是录音和播放设备选择器。Linux 和 Windows 上的音频子系统非常不同,因此设备选择器提供了不同的选项。

选择编辑 > 首选项 > 设备来设置您的默认录音和播放设备。这些可以从主 Audacity 窗口使用设备工具栏轻松覆盖。图 1-3 显示了在 Windows PC 上选中的 Plantronics USB 耳机。(第十五章详细介绍了配置和定制 Audacity。)

USB 设备总是通过名称宣布自己,因此您不必猜测。例如,在 Linux 和 Windows 上,录音设备选择器将显示“Plantronics 耳机”。如果您将麦克风直接连接到内置声卡,您需要知道声卡驱动程序的名字。在 Windows 系统上,不要选择 MME,这是过时的、通用的 Windows 音频接口。您想要选择现代的 Windows 音频子系统,在编辑 > 首选项 > 设备对话框中,在主机行上显示为“Windows DirectSound”。图 1-4 显示了在带有集成 SoundMAX 音频芯片组的手提电脑上选择应看起来是什么样子。

在 Ubuntu Linux PC 上的一个新、空的 Audacity 窗口

图 1-2. 在 Ubuntu Linux PC 上的一个新、空的 Audacity 窗口

选择编辑 > 首选项 > 设备来设置默认录音和播放设备。

图 1-3. 选择编辑 > 首选项 > 设备来设置您的默认录音和播放设备。

在 Linux 上,您将有更多的选择。“ALSA:default”在设备行上适用于内置声卡(除非您已更改 Linux 系统的默认声卡;参见第十三章了解有关 Linux 音频的所有信息)。选择 USB 设备的设备名称。完成操作后,点击确定关闭首选项对话框。

在 Windows Vista 上选择默认录音和播放设备。

图 1-4. 在 Windows Vista 上选择默认录音和播放设备。

注意

在 PC 上进行数字音频制作意味着您必须深入了解您的声卡驱动程序,并配置您的 PC 以获得良好的质量和性能。访问第十三章和第十四章了解如何调整系统以进行音频制作以及如何管理各种操作系统的小怪癖以控制音量级别、平衡和输入输出设备。

在开始录音之前,通过选择文件 > 另存为保存并命名您的新 Audacity 项目。对于每次新的录音来说,这是一个好习惯。

在下一节中,我们将学习所有工具按钮的相关知识。现在,将您的光标悬停在工具栏和按钮上,以了解它们的名称。

输入电平表

图 1-5. 输入电平表

现在我们来测试录音电平,在我们实际开始录音之前。转到图 1-5 中显示的输入电平表。点击开始监控并开始制造噪音。与模拟录音不同,使用数字音频,你不需要将录音电平推到红线。尝试将录音电平记录到-6 或-9 dB 的峰值。

你可以使用混音工具栏来控制录音和播放音量,某种程度上。它实际上不是一个混音器,而是一个录音和播放音量控制。这是带有扬声器和麦克风图标以及每个音量滑块的这个小工具栏。它不能控制所有内部声卡的音量,因为一些低端声卡没有支持音量控制的驱动程序。它也可能无法控制 USB 设备的音量水平,这取决于它们的驱动程序支持什么。如果情况如此,在 Windows 中,转到控制面板中的声音模块来控制音量水平。Linux 用户应使用 alsamixer。(记住,第十三章和第十四章将有助于这些。)或者,你也可以只是制造更响或更轻的噪音。

输入电平表使用两种不同深度的红色:明亮的红色条用于显示平均音量,深红色条用于显示峰值音量水平。细小的垂直蓝色线条标记了在会话期间达到的最高音量水平,而细小的垂直红色线条标记了最后三秒的峰值音量水平。在录音监控器的右边缘是削波指示器,当你的录音电平太大时,它们会变成红色。它们相当小,在录音电平下降后仍然亮着,这限制了它们的有用性。然而,你确实需要注意削波,这是当输入电平过高时发生的。任何超过 0 dB 的值都会产生削波,削波会导致失真。

现在让我们来录制一些声音。点击红色的记录按钮,并继续制造噪音。你会看到类似图 1-6 的东西。当你完成时,点击停止暂停按钮。使用停止按钮,下一次点击记录时,会开始一个新的轨道;暂停按钮让你可以在同一轨道上继续之前的位置。如果你本想暂停却停止了,不要担心——你可以通过按住 shift 键并点击记录来追加到一个现有的轨道。

终于,录音开始了!当你看到蓝色波形时,你就知道它在工作了。

图 1-6. 终于,录音开始了!当你看到蓝色波形时,你就知道它在工作了。

自然地,当你完成录音后,你将想听听你刚刚录制的声音,Audacity 提供了即时满足。点击播放按钮。如果你什么也听不到,那是因为你选择了错误的播放设备,或者音量控制设置得太低。在更改播放设备之前停止播放。当你将光标悬停在时间刻度上时,光标会变成一个小手,你可以点击时间刻度上的任何一点来再次开始播放。

在数字音频中,将录音录制到低峰值(如 -24 dB)是一种常见做法。数字音频分贝刻度以负数测量,直到零。我们能够感知到的最小变化大约是 1 dB,对于大多数人来说,-60 dB 几乎等同于静音,因此实际使用的范围是 -60 到 0 dB。+3 dB 的变化将音量翻倍,而 -3 dB 则将音量减半。

当你录制具有不可预测水平的某些内容时,如现场表演,超级低峰值(如 -24 dB)非常有用。在其他更受控制的情境中,良好的峰值水平在 -12 dB 和 -6 dB 之间。任何超过 0 dB 的声音水平都会导致削波,从而产生失真。在数字音频录制中避免失真非常重要。信噪比极高,因此你不需要将录音电平推到最大,只是为了保持噪声在可接受的水平。

低峰值意味着你的录音不会非常响亮,但这没有问题。你可以轻松地修复这个问题。通过点击音轨标签(图 1-7)来选择整个音轨。然后打开效果 > 规范化。在规范化对话框中勾选两个框,并将最大振幅设置为 0 (图 1-18)。

如何选择整个音轨

图 1-7. 如何选择整个音轨

规范化统一提升(或降低)你的音轨音量

图 1-8. 规范化统一提升(或降低)你的音轨音量。

最后一步是将你的新录音导出为可播放的音频文件。Audacity 使用其专有的特殊文件格式,该格式只能在 Audacity 中使用,因此你必须导出为在播放设备上可用的音频文件格式。选择文件 > 导出,将项目导出为 WAV 文件,这应该是默认选择(图 1-9)。你可以将导出文件命名为任何你想要的名称,也许是一些有创意的名称,比如 test.wav。WAV 格式几乎是通用的,几乎可以在任何数字播放设备或计算机软件媒体播放器上播放。

现在,您可以在计算机上播放您的test.wav文件,并听到它的全部魅力。Windows 用户可以使用默认安装的 Windows Media Player,或者从众多第三方程序中选择。Linux 用户也有许多媒体播放器可供选择:Amarok、Rhythmbox、VLC、Mplayer 以及更多。

最好将 WAV 格式作为默认的导出格式,因为它是一种无损、未压缩的格式,可以提供最高质量的录音。WAV 文件可以承受大量的编辑而不会降低质量,而损失格式(如 MP3 和 Ogg Vorbis)在每次编辑中都会丢失信息。您始终可以从 WAV 导出为低质量、损失格式的文件,但不能从低质量转换为高质量。

将您的音频文件保存为 WAV 格式

图 1-9. 将您的音频文件保存为 WAV 格式

好了,这就是简短的故事。继续阅读以获取完整版本。

Audacity 的详细说明

请记住,Audacity 支持几乎无限的撤销,因此可以安全地实验。撤销即使在保存后也有效;只有当您关闭项目文件时,您才会丢失撤销历史。

当您在一个项目上工作时,Audacity 不会直接操作您的音频文件。相反,它会将它们复制到一个临时文件中,将它们切成很多小块,并将这些小块转换为只有 Audacity 可以播放的.au扩展名的文件。您可以通过在任何文件管理器中查看您的项目目录来看到这一点。每个项目都有一个单独的.aup文件;这个文件包含 Audacity 需要用正确设置将这些小块文件重新组合在一起的所有元数据。当您从文件管理器打开 Audacity 项目时,选择.aup文件。

假设您有一段出色的表演录音,您表现得非常出色,让所有人都流下了喜悦的泪水(不是痛苦),而这个录音是 WAV 格式的。当您将这个 WAV 文件导入 Audacity 时,它会复制并转换为 Audacity 的内部.au格式。您的原始 WAV 文件安全无恙,并且不会改变,只要您不通过将项目导出回相同的 WAV 文件来覆盖它。

转换和分割您的文件可能听起来像是一件奇怪的事情要做,但操作许多小块文件比操作几个大文件要快得多。音频文件可以消耗许多兆字节,甚至吉字节。Audacity 有一个自动恢复机制,您只有在发生严重问题时才会看到它;当您重新打开 Audacity 时,它将显示一个恢复消息。未保存的数据保存在一个临时文件中,因此 Audacity 通常可以恢复它们。选择编辑 > 首选项来设置自动保存间隔;我的设置为两分钟。而且,就像我们在计算机上做的所有事情一样,良好的备份是必不可少的。如今硬盘空间很便宜,所以不要在存储上节省一分钱。

让我们从查看 Audacity 的工具栏开始我们的详细浏览。所有的工具栏在其左侧都有把手,因此您可以将其拖动到任何您想要的位置,甚至可以拖出 Audacity 窗口。将光标悬停在工具栏把手上时,工具栏名称会弹出。将光标悬停在按钮上以查看它们的名称。

选择视图 > 工具栏来控制哪些工具栏可见。

图 1-10 显示了控制工具栏,其中包含暂停、播放、停止、跳转到开始、跳转到结束和录音按钮。

现在让我们来认识一下工具栏上的按钮:选择、信封、绘图、缩放、时间移动和多工具(图 1-11). 这些按钮影响光标的功能。

控制工具栏

图 1-10. 控制工具栏

工具栏

图 1-11. 工具栏

在工具栏旁边是编辑工具栏(图 1-12),其中包含剪切、复制、粘贴、修剪、静音、重做、撤销、链接轨道、缩放、适应选择和适应项目按钮。

编辑工具栏

图 1-12. 编辑工具栏

表 1-1 列出了工具和编辑工具栏上所有按钮及其功能的描述。

表 1-1. 工具和编辑工具栏按钮

按钮 名称 描述
图片 选择 点击以标记播放起点。点击并拖动以选择轨道的一部分。双击以选择整个轨道。在时间标尺上点击任何位置以开始播放(它变为小手形状)。
图片 包络线 用于对轨道上的振幅(音量级别)进行精细控制,以及创建淡入和淡出效果。点击以创建控制节点,然后点击并拖动节点以增加或减少振幅。控制节点可以垂直和水平拖动。将节点拖过轨道边界以删除它们。
图片 绘图 点击放大按钮直到可以看到单个音频样本,然后使用绘图工具来操作它们。用于非常精细的点击和爆裂声的平滑处理。
图片 缩放 左键点击以放大,右键点击以缩小。记住缩放按钮!你可能经常会用到它们:使用放大来精确编辑,使用缩小来使长轨道易于管理。查看视图菜单以获取更多缩放命令和快捷键。
图片 时间移动 通过沿时间轴前后拖动音轨来同步音轨。你也可以将音轨或剪辑拖入另一个音轨,只要那里有足够的空间容纳它即可。
图片 多工具 这是一个包含五个工具的工具,根据鼠标位置激活。通过垂直移动光标获取选择和包络工具,通过在音轨的开始或结束处的音轨处理程序上悬停获取时间移动工具,通过将光标向左移动到分贝刻度获取缩放工具;缩放视图将围绕你悬停的分贝数字居中。当你足够放大以看到单个样本时,绘图工具会出现。
图片 剪切 这将移除选择并将其放在剪贴板上。
图片 复制 这将复制选择而不移除它,并将其放在剪贴板上。
图片 粘贴 这将在光标位置插入剪贴板内容或替换选择的内容。
图片 剪裁 这将删除除了选择之外的所有内容。
图片 静音 这将用静音替换选择的内容。
图片 重做 Audacity 支持几乎无限的撤销和重做,即使在保存项目之后也是如此,因此可以安全地实验。重做按钮会按顺序反转撤销操作或一系列撤销操作。你不能跳回到选定的操作;你必须按顺序重做所有操作。
图片 撤销 这将撤销你的最后一个操作,或按顺序撤销之前的一系列操作,即使在保存项目之后也是如此。你不能跳回到选定的操作;你必须按顺序撤销所有操作。
图片 链接音轨 这个工具的名称有些误导性。你可能认为它是用来选择多个音轨的,但它的功能实际上是“链接音频和标签音轨”,这与预期完全不同。当你开始一个新项目时,链接音轨默认启用,并在你修改音轨时保持音频和标签音轨同步。如果你没有标签音轨,它将不起作用。当你进行影响音轨长度的更改时使用它,例如删除音轨的一部分、插入静音或更改速度。在复制和粘贴整个音轨时关闭链接音轨,因为它会搞乱你的粘贴。链接音轨出现在 Audacity 1.3.9 版本中,在 2.0 系列中将不活跃,并计划在 2.1 系列中再次出现。
图片 放大 放大。您可以将放大到足够远,以看到单个样本。点击选择工具光标在您想要放大的点上,放大将集中在该位置。
图片 缩小 缩小。您可以将缩小到足够远,一次看到整个轨道。与放大类似,缩小将集中在您使用选择工具点击的点。
图片 适应选择 您可以放大选择以适应窗口水平方向。当您需要选择长轨道的一小部分进行工作时,这个工具可以节省大量时间。
图片 适应项目 此工具将整个项目调整大小以适应 Audacity 窗口的水平方向。选择视图 > 垂直适应以将整个项目适应到窗口中。

图 1-13 展示了仪表工具栏,它显示录音和播放电平。当它被压缩时,仪表工具栏可能不会在其刻度上显示较小的值。在这种情况下,您可以抓住它左侧的把手,将其移动到有更多空间的地方,然后抓住它右侧的调整大小把手,最后将其拉伸到可以看到整个分贝刻度。 |

仪表工具栏 |

图 1-13. 仪表工具栏

图 1-14 展示了混音工具栏,它实际上不是一个混音器。相反,它应该用于控制内部声卡的输入和输出音量级别。然而,这些功能只有在您的声卡驱动程序支持的情况下才会工作,所以如果它们不起作用,请责怪您的声卡制造商。(有关操作系统音频控制的信息,请参阅第十三章配置 Linux 以获得最佳音频质量和第十四章配置 Windows 以获得最佳音频质量。) |

混音工具栏 |

图 1-14. 混音工具栏 |

转录工具栏 |

图 1-15. 转录工具栏 |

转录工具栏(图 1-15 展示了设备工具栏,在这里你可以选择你的录音和播放设备,而无需选择 编辑 > 首选项。如果你插入或移除一个 USB 设备,你需要重新启动 Audacity,否则它将看不到变化。

设备工具栏

图 1-16. 设备工具栏

最后,如图 图 1-17 所示的选择工具栏,提供了多种不同的比例,用于精确的音频轨道部分定时和选择,以及设置视频音轨和 CD 音频的正确帧率。

选择工具栏

图 1-17. 选择工具栏

管理 Audacity 项目

在新的 Audacity 项目中,你的第一步始终应该是使用 文件 > 另存为 来命名它。然后你可以定期按 ctrl-S 保存更改或使用 文件 > 保存。除了项目的主元数据文件 .aup 之外,Audacity 还会创建一个包含相关音频文件的目录。你可以在文件管理器中查看这些文件;将会有许多包含 .au 扩展名的子目录。

添加音频文件:导入与打开

选择 文件 > 打开 将现有音频文件添加到新的、空的项目中。之后,选择 文件 > 导入 添加更多文件。在非空项目中选择 文件 > 打开 将文件在新窗口中打开。

保存你的工作

Audacity 项目优化用于快速工作空间,不适合归档存储。没有快照机制来保存不同阶段的工作,用户报告说项目损坏时丢失了数据。我采用了一种“双保险”的方法:我为 Audacity 项目文件做备份,同时也制作了 WAV 格式的录音室母带文件,因为每种方法都有其优点和缺点。首先,我们将探讨在不同阶段保存 Audacity 项目的方法,然后我们将探讨如何制作 WAV 格式的录音室母带。

你可以通过从原始项目创建多个 Audacity 项目来创建类似项目快照的东西。首先,创建一个目录来保存相关项目,这样它们就不会混淆或丢失。然后选择文件 > 另存为项目,并为项目命名以帮助你记住里面的内容,例如 Summer-Festival-1,Summer-Festival-2,或者更描述性的名称,如 Summer-Festival-No-Banjos 或 Summer-Festival-Mondo-Banjos。当你这样做时,你会看到一个类似于图 1-18 的对话框。这里的关键问题是“将以下文件中的音频复制到你的项目中以使其自包含?”通过点击复制所有音频到项目(更安全)按钮来回答“是”。这会复制项目文件并使用更多的磁盘空间,但这是最安全的选项。在多个项目之间共享文件可以节省磁盘空间,但带来的麻烦不值得,因为一个项目中的更改会影响所有项目。更糟糕的是,你失去了冗余,这是你防止任何一个项目损坏和无法使用的一种保险。

在新项目名称下保存你的项目副本

图 1-18. 在新项目名称下保存你的项目副本

你可以在编辑 > 首选项 > 项目对话框中控制这种行为:当保存依赖于其他音频文件的项目时。这提供了三个选择:“始终将所有音频复制到项目中”,“不复制任何音频”,或“询问用户”。

要制作一个高质量的录音室母带 WAV 文件,通过选择文件 > 导出来导出你的项目。你可以在项目工作的任何时间这样做,创建多个母带来保存你在不同阶段的成果(或者直到你的磁盘空间用完为止!)。然后你可以随时导入 WAV 母带进行进一步编辑,并且可以从你的 WAV 母带导出任何其他音频格式。这也为你提供了将 WAV 母带导入另一个音频编辑程序的选择,这是你不能用 Audacity 的项目文件做到的。

WAV 的默认导出质量设置为 16 位整数,这不是最高的质量。Audacity 的默认录音质量设置(选择编辑 > 首选项 > 质量)是采样率为 44.1 kHz,位深度为 32 位浮点。(Audacity 术语将位深度称为样本格式,但位深度是正确的术语。)你可以通过导出为 32 位浮点 WAV 来创建一个高质量的录音室母带。按照以下步骤操作:

  1. 选择文件 > 导出

  2. 选择保存类型:其他未压缩文件。

  3. 点击选项,然后选择头信息:WAV(微软)和编码:32 位浮点。

你将看到一个类似于图 1-19 所示的窗口。

将项目导出为 32 位浮点 WAV 文件

图 1-19. 将项目导出为 32 位浮点 WAV 文件

生成的文件不是一个可播放的 WAV 文件,除非在 Audacity 和其他使用 32 位浮点进行编辑的音频编辑器和数字音频工作站中。然而,这对于录音室母带来说非常棒,因为你可以以非常小的质量损失导入和编辑 32 位浮点 WAV 文件,并将它们导出为其他音频格式:16 位和 24 位 WAV、Ogg Vorbis、MP3、FLAC 等等。WAV 文件支持单个文件中最多 32 个音轨。

然而,这也存在其缺点。当你只有少量音轨需要管理时——我的极限是四个——这还可以正常工作,因为 Audacity 不会保存音轨名称,而是将所有音轨重命名为 WAV 文件名。假设你有一个四轨录音,音轨分别命名为vocalpianoviolinvocal2。将此项目导出为单个 WAV 文件,并将其命名为testwav.wav。当你将testwav.wav导入 Audacity 时,所有四个音轨都会被重命名为testwav 1.wavtestwav 2.wav等等。这也使得 1 号和 2 号音轨变成了左右声道,即使它们原本是单声道音轨。图 1-20 展示了前后对比。

将项目导出为 WAV(左侧是导出为 WAV 格式之前的原始项目,右侧展示了将 WAV 文件导入 Audacity 后发生的情况)

图 1-20. 将项目导出为 WAV 格式(左侧是导出为 WAV 格式之前的原始项目,右侧展示了将 WAV 文件导入 Audacity 后发生的情况)

你仍然拥有所有单独的音轨,但会丢失音轨名称。在多轨项目中,我非常依赖音轨名称来保持组织有序,所以将它们全部合并成一个 WAV 文件对我来说不起作用。

对于包含超过四个音轨的项目,我更喜欢将每个音轨保存为单独的 WAV 文件。为此,选择你想要导出的音轨,然后选择文件 > 导出多个。(我们将在下一节讨论如何选择音轨。)每个音轨都将保存为单独的文件,音轨名称将成为相应文件的文件名。当我这样做时,我会将它们放在它们自己的项目目录中,这样就不会与其他项目混淆。

选择音轨和音轨片段

现在我们来学习如何选择轨道和轨道的部分。Audacity 支持计算机用户熟悉的常规编辑功能——复制粘贴、删除、选择等,但如果你不学习如何用 Audacity 的方式来做这些操作,它可能会让你感到疯狂。Audacity 的一个不错的特点是它支持几乎所有功能的键盘快捷键,因此你可以使用鼠标或键盘。

首先,通过选择文件 > 导入来创建一个新的录音或导入现有的音频文件,这样你就有一些轨道可以进行实验。确保选择工具是激活的。如果你使用的是多工具,将其上下移动直到它变成选择工具,它看起来像一个小 I 形光标。

轨道焦点和轨道选择是两回事。黄色的轨道边框显示哪个轨道有焦点,但如果轨道面板是浅色,则表示该轨道未被选中。有焦点意味着该轨道已准备好接受键盘命令;光标行在该轨道中是活跃的,你可以使用箭头键移动它。

图 1-21 显示了两个轨道:下面的轨道有焦点,由黄色边框表示,而上面的一个被选中,由阴影轨道面板表示。光标行延伸到两个轨道中,但在下面的轨道中是活跃的。有一个被选中的但没有焦点的轨道和一个有焦点的未被选中的轨道并没有太大用处。你可以在有焦点的轨道中选择播放的起始点,并使用箭头键移动它,但这基本上就是全部了。

最上面的轨道被选中但没有焦点,而下面的轨道有焦点,由黄色边框表示,但未被选中。

图 1-21。最上面的轨道被选中但没有焦点,而下面的轨道有焦点,由黄色边框表示,但未被选中。

当选择一个轨道时,它将成为你执行的所有编辑操作的目标,例如复制、剪切或应用效果。即使它没有焦点,这些操作也会应用于整个轨道。选择整个轨道有两种方法:你可以在波形上任何地方双击,或者你可以点击轨道面板中的轨道标签(见图 1-17)。

大多数时候你不需要注意焦点和选择,因为在正常的编辑过程中,它们会处于你想要的位置。但有时事情会表现得古怪,了解这种区别应该有助于你理解当 Audacity 似乎神秘地响应时发生了什么。

您还可以选择轨道的一部分。图 1-22 显示了一个只选择部分而不是整个轨道的轨道。注意所选部分与未选择部分之间的阴影差异。

顶部轨道的一部分被选择。一些笔记本电脑屏幕不够亮,使得在轨道面板中难以清楚地看到阴影,因此也要查看时间轴。

图 1-22. 顶部轨道的一部分被选择。一些笔记本电脑屏幕不够亮,使得在轨道面板中难以清楚地看到阴影,因此也要查看时间轴。

ctrl-A 选择所有轨道,而 shift-ctrl-A 取消选择所有轨道。在轨道内部双击以仅选择该轨道,或在轨道标签上左键单击。shift-单击轨道标签可以逐个选择和取消选择多个轨道,以及非相邻轨道。在 图 1-23 中,第一和第三条轨道是通过 shift-单击选择的。

通过按住 shift 键并点击轨道标签来选择非相邻轨道

图 1-23. 通过按住 shift 键并点击轨道标签来选择非相邻轨道

要选择轨道的一部分,请使用选择工具单击并拖动。要调整选择的大小,将光标移至选择的任一边界,光标将变成水平箭头,然后单击并拖动该边界(图 1-24)。

您可以使用键盘的箭头键在轨道之间导航并调整选择。按住 shift 键并按下左箭头或右箭头键可以放大选择;按住 ctrl-shift 键并按下左箭头或右箭头键可以使选择缩小。要选择多个相邻轨道,可以先在顶部或底部轨道上做出选择,然后按上箭头或下箭头键以在其他轨道上重复选择。

通过单击和拖动边界来调整选择的大小

图 1-24. 通过单击和拖动边界来调整选择的大小

在您的控制工具栏中的“跳转到开始”和“跳转到结束”按钮可以将光标移动到音轨的开始或结束位置。在点击“跳转到开始”按钮的同时按住 shift 键,将从光标位置选择到音轨的开始,而在点击“跳转到结束”按钮的同时按住 shift 键,将从光标位置选择到音轨的结束。

您还可以使用选择工具栏根据各种音轨参数(如时间、样本以及各种音频和视频帧率)进行精确选择。您可以通过点击工具栏上任意三个字段中的下拉菜单来查看这些参数(图 1-25)。

选择工具栏支持基于多个有用的音轨参数的选择

图 1-25. 选择工具栏支持基于多个有用的音轨参数的选择

假设您想选择从音轨开始 48 秒处的 12 秒片段。有多种方法可以到达 48 秒的标记——使用选择工具点击,使用箭头键导航,或使用选择工具栏。设置选择开始:秒并输入 48。选择“结束”单选按钮,并在中间框中输入 60。这就是您的 12 秒片段(图 1-26)。

使用选择工具栏选择音频音轨的精确部分

图 1-26. 使用选择工具栏选择音频音轨的精确部分

上箭头和下箭头键也可以更改数字,而右箭头键和左箭头键可以前后导航。

音轨面板

便捷的音轨面板

图 1-27. 便捷的音轨面板

音轨面板将许多有用的快捷方式放在您的指尖上(图 1-27)。左上角的X可以删除音轨。底部的箭头可以折叠和展开音轨。您还可以使用鼠标拖动音轨边框来改变它们的宽度。增益滑块可以放大或减小音轨音量,而不会永久更改它,这在混音多个音轨时是必不可少的。平衡滑块控制左右平衡。

默认情况下,当您点击播放按钮时,Audacity 会播放项目中的所有音轨。使用独奏按钮选择一个音轨进行播放,或使用静音按钮静音您不想听到的音轨。这仅影响 Audacity 中的播放,并不会更改您的项目文件。

音轨菜单功能

图 1-28. 音轨菜单功能

轨迹菜单包含一个有趣的杂货袋功能(图 1-28)。您可以使用它来创建音轨名称——当您处理大量音轨时,您肯定希望给它们命名。它还提供不同的波形视图;允许您拆分或合并立体声音轨;允许您设置单声道、右声道或左声道;允许您移动音轨上下;并且允许您更改位深度(Audacity 称为采样格式)和采样率。

立体声音轨可以通过拆分立体声音轨或拆分立体声到单声道来拆分为两个单独的单声道音轨。使用拆分立体声音轨时,一个将是右声道,另一个将是左声道。使用拆分立体声到单声道时,将创建两个单声道音轨。要创建立体声音轨,请将两个单声道音轨并排放置,然后在上方音轨的轨迹菜单中点击制作立体声音轨。通过点击并拖动音轨标签或通过在轨迹菜单中选择移动音轨上下来移动音轨。

轨迹面板右侧的垂直刻度是您了解音轨音量的指南。默认显示为波形,您可以通过轨迹菜单将其更改为波形(dB)、频谱或音高(EAC)。波形是一种常用的视觉刻度,用于显示音轨的幅度(信号的强度或音量)。波形垂直标尺具有+1.0 到-1.0 的线性刻度;任何超出这些值的都表示削波,这意味着您正在获得一些失真。线性意味着所有频率在刻度上都被赋予相同的权重。分贝是对数而不是线性的,所以这不是真正的表示,但它很容易阅读。

波形(dB)显示幅度使用对数分贝刻度。不深入数学细节,对数意味着每个 3 dB 的增加代表响度加倍——因此,测量为 6 dB 的声音比测量为 3 dB 的声音响亮一倍,9 dB 的声音比 6 dB 的声音响亮一倍。人类能感知的最小变化增量约为 1 dB。(在词汇表中了解更多关于音频术语的信息。)

数字音频有一个特殊的分贝刻度,即零分贝全量程。这表示数字音频音量范围,用负数表示,最大值为 0。在 Audacity 中,您可以在编辑 > 首选项 > 界面对话框中控制波形(dB)视图和仪表工具栏上显示的分贝范围。最小刻度是-36 dB 到 0,最大刻度是-145 dB 到 0。这仅影响显示,对音频音轨没有任何影响。

你可以使用波形显示来监控你的录音电平;我认为默认的波形显示最容易阅读。你会注意到显示使用了两种蓝色的阴影,一种较浅,一种较深。浅蓝色代表均方根(RMS),或称均方根,用普通英语来说就是随时间变化的平均音量。深蓝色代表峰值,即瞬间的极端值。

注意

均方根和峰值评级在音频设备的营销中被(错误地)使用,让你觉得你得到了比实际更多的东西。例如,一套扬声器被评定为 50 瓦 RMS/150 瓦峰值。忽略峰值值——RMS 告诉你扬声器可以连续承受多少。峰值值表示扬声器在非常短的时间(秒的分数)内可以承受多少。

频谱视图用颜色表示不同频率的能量水平(振幅)。红色是“热”的,或振幅较高,蓝色是“冷”的,或振幅较低。如果你的波形主要是蓝色,那么它不是很响亮,如果它更多是红色,那么它更响亮。你可以通过选择一个轨道或轨道的一部分,选择效果 > 放大,并给它一个负放大值-30 dB 来轻松测试这一点。这应该使它主要是蓝色。给它一个接近零的值,使其更红。

音高(EAC)使用增强自相关(EAC)算法显示你的音频音高的轮廓。EAC 算法对音高检测很有趣;如果你对此感兴趣并想了解更多,增强自相关音高检测是一些好的互联网搜索词。Audacity 的这种实现相当基础,所以如果你对此感兴趣,你可能想找到更复杂的工具。

删除不需要的部分

你可以轻松地删除你不需要的轨道部分。只需选择一个部分,然后按下键盘上的删除键。如果你想只保留轨道的一小部分并删除其余部分,请选择编辑 > 裁剪或点击编辑工具栏上的裁剪按钮。这将保存你选择的轨道部分,并删除其外的所有内容。

有时候你可能需要在保持轨道完整的同时,使轨道的较大部分静音。在这种情况下,选择你想要转换为静音的部分,然后点击静音按钮或选择编辑 > 静音音频

渐入和渐出

当你删除轨道的一部分时,你可能想用优雅的渐变来平滑切割。渐变是音频编辑的重要组成部分,Audacity 有两种创建渐变的方式。最简单的方法是选择轨道的一部分,然后选择效果 > 渐入渐出。你控制渐变的长度,Audacity 完成其余的工作。

包络工具可以微调幅度级别;它适用于控制淡入淡出,以及在音频轨道的任何地方进行幅度微调,包括相对较长的段落。图 1-29 显示了这看起来是什么样子。点击不同的位置来创建控制节点。要删除节点,将其拖出音轨边界。

包络工具创建优雅的淡入淡出,并为您提供对幅度的高精度控制。

图 1-29. 包络工具创建优雅的淡入淡出,并为您提供对幅度的高精度控制。

每个节点有四个手柄。节点手柄可以沿任何方向移动。外对手柄的行为略不同于内对手柄——使用外对手柄创建更优雅、更平缓的曲线。

30 秒标记两侧的虚线显示了包络的边界超出音轨显示的地方。

注意

除了编辑工具栏中的 Zoom 按钮外,视图菜单还有一些很好的选项来操作和导航您的音轨,例如“Fit In Window”和“Zoom to Selection”,并且它显示了有用的快捷键,如 ctrl-2 用于正常缩放和 shift-ctrl-F 用于垂直缩放。

使安静录音更响亮

假设您的录音太安静,您想提高音量。没问题!选择您想要放大的部分,然后选择效果 > 放大。Audacity 会自动计算可以应用的最大放大倍数,即不超过 0 dB(图 1-30)。除非您非常确定要这样做,否则不要勾选“允许剪辑”框。

使用效果 > 放大来提升或降低所选内容的音量

图 1-30. 使用效果 > 放大来提升或降低所选内容的音量

另一种放大太安静录音的方法是选择效果 > 归一化。勾选“移除任何直流偏移”,勾选“归一化最大幅度到”,并将最大级别设置为 0。直流偏移指的是平均幅度;如果这不是零,则归一化将不会正确应用,因为幅度级别将不平衡,可能会产生一些失真。

当应用到多个音轨时,放大和归一化的区别变得明显。放大将所有音轨的音量按相同比例改变。如果您将音量放大+9 dB,峰值在-20 dB 的音轨将被提升到-11 dB,而峰值在-9 dB 的音轨将被提升到 0 dB。另一方面,归一化会调整所有音轨到相同的最大音量级别,因此某些音轨可能比其他音轨改变得更多。

两者默认的最大设置都是零。将这个值降低到-12 dB 左右在你的工作室母带中很有用,这样可以留出一些空间进行更多的调整,而不会冒剪辑的风险。例如,当你将多个轨道下混到单个轨道时,后者将具有所有这些轨道的振幅总和,并且会变得更响,可能非常响。经验将告诉你你需要多少空间。在你制作最终导出之前,不要将归一化设置为零。

放大和归一化也可以用来降低振幅。在放大对话框中,输入一个负值,例如-6。归一化对话框只使用负值,并且不允许高于零的任何值。

定时录音和声音激活录音

无论是定时录音还是声音激活录音,都在传输菜单中。要使用声音激活录音,选择传输 > 声音激活水平并设置你想要触发录音的分贝水平。可能需要一些尝试和错误才能找到一个既能捕捉到你想要的,又不会捕捉到太多不想要的噪音的水平。然后打开录音监视器(仪表工具栏)并点击播放按钮。当检测到足够大的声音时,Audacity 将自动创建一个新的轨道,并使用该轨道直到你停止定时录音。任何时候点击停止按钮都可以停止声音激活录音。

定时录音同样简单——只需设置录音的开始和停止时间。你可以将此与声音激活录音一起使用,设置一个开始和停止范围,这样你就可以离开并让 Audacity 运行,而不用担心它会填满你的硬盘。

混音板

混音板是 Audacity 1.3.8 版本中首次出现的新功能(图 1-31)。

混音板将平衡和增益控制置于前端和中心。

图 1-31. 混音板将平衡和增益控制置于前端和中心。

这是一个小巧的混音板,每个轨道都有音量单位(VU)表,还有平衡和增益滑块。它将你的基本混音控制置于容易触及的位置,而无需使你的轨道变得过宽,以便可以访问轨道面板上的滑块。

要使用混音板,在 Audacity 中播放你的轨道,并使用位于 VU 表左侧的增益滑块调整轨道的相对音量,以及使用平衡滑块调整每个轨道的左右平衡。然后进行导出。平衡和增益滑块不会改变你的项目文件——它们只影响 Audacity 中的播放以及导出文件的声音。参见第九章了解更多关于多轨混音的信息。

跟踪元数据

您可以使用元数据编辑器在 Audacity 项目中保留有用的数据,例如歌曲标题、日期、艺术家名称和流派。在最终导出之前,选择文件 > 打开元数据编辑器。您将看到一个类似于图 1-32 中的窗口。填写任何艺术家名称、专辑标题、年份、流派和注释字段,这些信息将被应用到每首歌曲轨道上。Audacity 将自动填写轨道标题和轨道编号字段。

使用文件 > 打开元数据编辑器以在 Audacity 项目中存储有用信息

图 1-32. 使用文件 > 打开元数据编辑器以在 Audacity 项目中存储有用信息

如果您选择编辑 > 首选项 > 导入/导出,有一个“在导出步骤之前显示元数据编辑器”选项。如果您勾选此选项,则在导出每个轨道之前,元数据编辑器将打开,以便您可以审查或编辑元数据。

最终混音

通常您的目标是将您记录的任意数量的轨道混音到一个立体声轨道上。然而,Audacity 也支持多声道环绕声,这在第九章中有详细说明。在导出之前,选择编辑 > 首选项 > 导入/导出并选择“使用自定义混音”单选按钮。在导出时,将出现一个高级混音选项窗口,它是一个简单的通道映射器。将您的轨道映射到您想要的任何通道。您的轨道可以映射到左通道、右通道,甚至多个通道。当有两个轨道时,通道 1 始终是左通道。(参见图 1-33 中的简单双轨道示例。)当您使用此工具时,您会为给您的轨道命名而感到高兴。第九章更详细地介绍了多轨混音和通道映射。

使用 Audacity 的混音器将您的轨道映射到正确的通道

图 1-33. 使用 Audacity 的混音器将您的轨道映射到正确的通道

音频文件格式和质量设置

有许多不同的音频文件格式,Audacity 支持其中很多。让我们看看 WAV、MP3、FLAC 和 Ogg Vorbis。这些广泛支持的流行格式服务于不同的目的。

理解文件格式

WAV 文件是不压缩的高质量脉冲编码调制(PCM)文件。它们很大。一张 CD 质量的立体声 WAV 录音大约消耗 10MB 的磁盘空间。WAV 是支持最好的格式,并且是其他格式衡量质量的标准。

MP3(MPEG-1 音频层 3,不是 MPEG-3)是一种流行的压缩、有损编码格式;一个 MP3 文件可以小到与类似 WAV 文件十分之一的大小,同时听起来仍然相当不错。这意味着你可以将更多的音乐塞进便携式播放器,并实现更快的下载和更好的在线流媒体。代价是质量有所损失。参见第十三章和第十四章了解如何在 Audacity 中启用 MP3 支持。

虽然 MP3 非常流行,但它却受到混乱的专利问题的困扰。不同国家的多家公司声称拥有 MP3 的专利,根据你所在的地方,如果你想要分发编码为 MP3 的音乐,可能需要支付许可费用。最后的专利将在 2017 年到期。然而,专利情况并不明确,因为许多独立音乐家在他们的祖国之外的国家分发 MP3 格式的音乐而不支付专利版税,并且专利并不适用于所有非原产国的国家。

无损音频编解码器(FLAC)是一个优秀的开放和免费格式。这种无损、压缩的格式在质量上与 WAV 相当,但文件大小可以小三分之一到一半。FLAC 是一个非常适合 PC 媒体服务器的格式,因为你可以得到高质量的音乐,而不会占用太多的硬盘空间。在线音乐服务以 FLAC 格式提供他们最高质量的下载。如果你需要节省存储空间,甚至可以使用 FLAC 作为你的录音室母带。尽管 FLAC 格式不支持 32 位浮点,但 24 位 FLAC 文件仍然非常高质量。

Ogg Vorbis 被创建为一个高质量、免费和开放的 MP3 替代品。Ogg 文件的尺寸从与 MP3 相当到大约大 25%。尽管 Ogg Vorbis 不像 MP3 和 WAV 那样广泛支持,但其受欢迎程度正在增加。Linux、Windows 和 Mac 都有许多支持播放独立 Ogg 文件和流式传输 Ogg 的软件音乐播放器。iPod 和 Zune 不支持 Ogg(这并不令人惊讶,因为它们来自两个锁定技术的巨头),但越来越多的其他播放设备支持 Ogg。

第七章详细介绍了 Ogg Vorbis 和 MP3 的不同质量级别,第六章讨论了 WAV 和 FLAC。

下一节将解释一些数字音频的重要基本概念和术语,你会在很多地方遇到它们,所以请泡一杯茶,放松一下,继续阅读。

理解比特深度和采样率

数字音频制作可以总结为将模拟信号转换为数字,然后再转换回模拟。换句话说,您从模拟麦克风或电子乐器中捕获声音,通过模拟到数字转换器(ADC)处理,并将数字化的比特记录到硬盘或固态存储器中。ADC 可以是声卡、预放大器/ADC、独立的 ADC 或其他组合设备。在某个时候,这些数字数据将被检索并转换为模拟形式以进行播放。

您的计算机声卡在播放时执行数字到模拟转换,普通的 CD 或 MP3 播放器也是如此。

您的目标是以尽可能忠实的方式转换这些模拟信号。一旦它们以数字形式存在,您就有了一个全世界的工具来以各种创造性的方式操纵它们,并且您有大量的播放格式和媒体选项。

16/44.1,24/96,32 位浮点

两种常见的数字音频规格被称为 16/44.1 和 24/96。有时 16/44.1 被简称为 16/44。这些标识指定 位深度采样率。位深度影响动态范围、信噪比和保真度。采样率决定频率范围。

CD 音质音频定义为 44.1 kHz、16 位、双通道 WAV,而 24/96 是高于 CD 音质音频,如数字音频磁带(DAT)、DVD 音频和录音室母带录音。所以,我们应该只选择最高的数字以获得最佳质量,对吧?嗯,不——还有许多因素需要考虑。

Audacity 波形,放大以便可见样本点

图 1-34. Audacity 波形,放大以便可见样本点

采样 由模拟到数字转换器执行;它在模拟音频信号中的电电压以一定间隔进行采样,并将测量值转换为数字形式。每秒进行的次数越多,信号的数字表示就越准确。因此,44.1kHz 的采样率意味着每通道每秒 44,100 个样本。这是 Audacity 的默认设置。您可以通过放大任何 Audacity 波形的一部分来查看这个图像。这看起来像 图 1-34,其中每个点代表一个单独的音频样本。

每个音频样本都表示为一个数值——在计算机中,一切都是数字。在 CD 音质音频中,每个样本可能的值范围是 16 位,16 位 = 65,536。这是 位深度。每个样本的大小不是 65,536 位,而是给定一个等于或小于 65,535(0 到 65,535)的单一 16 位值。

对于 24/96 录音,这在专业录音中经常使用,24 位可以提供 16,777,216 种可能值。更大的位深意味着更宽的动态范围和更细腻的音色变化——同时也意味着文件大小显著增加。立体声录音一分钟大约是 10MB(每个声道 5MB)在 16/44.1 的采样率下,而在 24/96 的采样率下大约是 34MB。

理论上,16 位数字音频的动态范围是 96 分贝,范围从-96 到 0。对于 24 位音频,动态范围是 144 分贝,对于 32 位音频,动态范围是 192 分贝。在现实世界中,由于电子硬件的限制,实际的动态范围会更低:16 位音频大约是 90 分贝,24 位和 32 位音频大约是 115 分贝。

广阔动态范围的价值不在于你可以用突然的极端音量变化来震惊听众,而在于拥有非常高的信噪比,这也被称为“低噪声地板”。信号越多,噪声越少,效果越好。

就调整动态范围以考虑听众而言,录音中的 50 分贝到 60 分贝的范围是大多数听众能够容忍的最大值,而且在理想条件下,在一个安静的环境中,使用一个好的系统。一个挑剔的音响爱好者,拥有良好的设备和安静的听音空间,会欣赏到使用 60 分贝动态范围的交响乐。一场现场交响音乐会可能涵盖 80 分贝的范围。

在一个嘈杂的环境中或使用低质量音频设备听音乐的人可能会更适应 20 分贝或更窄的动态范围。Audacity 允许你根据需要调整录音的动态范围。(参见第六章,第八章,和第十一章了解更多关于动态范围压缩的信息。)

在音频领域有一个著名的定理,称为奈奎斯特-香农定理。它很长且详细——这里重要的部分指出,当采样率至少是信号中最高频率的两倍时,可以实现模拟音频信号的完美数字表示。人类最好的听力可以达到 20 kHz 到 24 kHz,因此 40 kHz 到 48 kHz 的采样率(理论上)可以重现人类听力的整个范围。

Audacity 的默认录音比特深度是 32 位浮点。许多数字音频工作站,包括 Audacity,在内部以 32 位浮点运行。重要的是要理解这是 32 位浮点,而不是 32 位整数。相比之下,16 位和 24 位深度代表整数值。通常,数学是复杂的,如果他们愿意,音频专家会把你讲得泪流满面,所以这里有一个简化的故事:整数是整数,而浮点意味着浮点小数点。这个 32 位浮点数是一个 24 位的尾数加上一个 8 位的指数。这在音频制作方面很重要——它给你大约 1500 dB 的动态范围,这意味着几乎没有噪声或削波,你可以在整个模拟到数字转换范围内获得更平滑、更准确的响应曲线。(相比之下,32 位整数的动态范围是 196 dB。)

即使使用 16 位录音接口,在 32 位浮点下录音和编辑也是有利的。如果你将峰值设置为-24 dB,这是一个非常低且安全,可以避免削波的水平,你的可用动态范围仍然会超过任何硬件支持的动态范围,你将有足够的额外位可以丢弃而不损害质量。这意味着你可以随心所欲地编辑和操作你的音频文件,并且仍然能够制作高质量的 16 位和 24 位导出。你对录音应用的处理越多,你就越需要所有那些额外的空间。

你总是会导出到较低的比特深度,因为没有 32 位浮点播放设备。可播放的格式必须是整数数据,所以你的导出总是到 8 位、16 位或 24 位整数。(经常使用线性这个词代替整数;它们指的是同一件事。)

在实践中,许多因素会影响你选择的比特深度和采样率:你的听力有多好,你的设备有多好,最终格式和播放介质将是什么?你的录音技术有多好?你正在制作什么样的录音——是细微的乐器和声乐还是震撼的重金属摇滚?你的电脑是否足够强大以处理更大的音频文件,并且你有足够的存储空间吗?

由于“越大越好”的心态,你可以以优惠的价格购买 16/44.1 录音机和 ADC。另一方面,拥有额外的带宽也无妨——你总是可以降低质量和大小,但(尽管电视犯罪节目中会展示给你)你无法恢复最初没有的内容。当你进行实验时,我的建议是先增加比特深度,然后再增加采样率。如果你的听力和音频设备很好,你应该能够听到 16 位和 24 位录音之间的差异,尽管我怀疑需要并排比较才能使差异明显。我以 32 位浮点/48 kHz WAV 格式录音并保存我的工作室母文件,主要导出为 CD 质量的 16/44.1。提高采样率对我来说没有听到任何差异,而且它会消耗硬盘空间。

Audacity 支持以 16 位整数、24 位整数和 32 位浮点进行录音。相比之下,专业人士在 24 位、32 位甚至 64 位深度进行录音和编辑。

注意

如我们之前讨论的,将文件导出为 32 位浮点 WAV 是一个值得考虑的好选项,用于创建和存档工作室母文件。然后你可以将你的 32 位浮点 WAV 文件导入 Audacity(或任何使用 32 位浮点的其他音频编辑器),处理它,然后无损地导出为 16 位或 24 位。

比特率、比特深度和文件大小

比特深度是一个具有特定含义的术语,我们刚刚学习了。另一个常见的术语是比特率。这两个术语意味着不同的事情,并且经常被混淆。比特率是传输音频文件每秒所需的数据量,通常以 Kbps 或 Mbps 表示;16/44.1 立体声大约是 1.4Mbps,而 24/96 大约是 4.6Mbps。你可以很容易地自己计算出这个数值:

比特深度 × 采样率 × 通道数 = 比特率(比特/秒)

16 × 44,100 × 2 = 1,411,200 比特/秒

24 × 96,000 × 2 = 4,608,000 比特/秒

MP3(以及其他有损格式)是用比特率而不是比特深度/采样率来描述的。MPEG-1 层 3 标准指定了从 32Kbps 到 320Kbps 的比特率范围。相当低音质,128Kbps 是早期较慢的互联网下载速度和存储容量较小的播放器中常见的 MP3 比特率。现在 192Kbps 相当普遍,一个听力好且 MP3 播放器不错的用户会听到差异。

总文件大小是录音发烧友的一个重要数字。数字音频文件很大,在繁忙的录音过程中,大量的录音会很快消耗掉大量的硬盘空间。

你可以用这个公式计算大约的文件大小:

比特深度 × 采样率 × 通道数 ×(60 秒)/ 8 = 文件

1 分钟录音的字节数

24/48 kHz 的立体声 1 分钟大约是 17.3MB:

24 × 48,000 × 2 × 60 / 8 = 17,280,000 字节

你必须除以 8 来得到字节,因为每字节有 8 位。

现在怎么办?

到目前为止,你应该已经很好地掌握了 Audacity 的基础知识。Audacity 易于学习;难点在于学习音频概念和术语。在这本书的剩余部分,我会大量讨论这些内容,将它们转化为实际术语,并展示如何在 Audacity 中实现它们。

第二章. 节省成本建立良好的数字声音工作室

无标题图片

在摄影界有句俗语:相机后面的人比相机更重要。同样的道理也适用于制作优秀的音频录音——设备后面的人比设备更重要。这并不意味着设备不重要,因为它是重要的。但仅仅拥有最昂贵、最精英的音频设备并不能让你成为汤姆·道德或里克·鲁宾或昆西·琼斯或乔治·马丁或你最喜欢的传奇音乐制作人。它也不会将普通音乐家变成明星。

当你在购买音频设备并陷入“更高规格和价格标签就是更好!”的误区时,请退一步,重启你的思维。深呼吸,放慢速度,专注于学习如何从低端设备中获得最佳效果。因为今天的平均数字音频设备比过去的顶级模拟录音室设备更好,具有更高的精度、保真度、更宽的动态范围和更少的噪声,这使得录音、混音、编辑和应用特殊效果变得容易得多。你不必那么费心去学习如何使用你的设备,你可以更多地专注于学习如何以艺术和技术保真度制作好的录音。然后,如果你发现自己渴望更好的前置放大器、更好的麦克风、更好的扬声器或其他设备,你会有充分的理由,当你找到它时,你会了解并欣赏更好的质量。

在本章中,我们将把 PC 变成一个数字音频工作站,而不会花费太多钱。我们还将探讨便携式数字录音机,它们将惊人的保真度和存储容量压缩到小巧的设备中,在各种情况下都非常有用。

从计算机中获取声音输入和输出

在基于 PC 的音频制作中最大的挑战之一是确定音频设备。有大量的音频组件,具有各种可想象的功能和价格标签的组合。在本章中,我将讨论小型录音室的基本元素。附录 A 更详细地介绍了硬件,包括不同价格范围内的不同型号和品牌的示例。

有几种方法可以将音频设备与电脑连接起来:台式电脑的 PCI 或 PCI-E 声卡;笔记本电脑的 Cardbus 或 ExpressCard 声卡;任何电脑的 USB 1.1、USB 2.0 或 FireWire 音频接口。您需要其中之一。哪一个?对于单轨或双轨录音,任何一种都行。对于重型多轨录音,USB 1.1 不是一个选择。但它非常适合单轨或双轨录音,您将有很多优秀且价格适中的设备可供选择。对于严肃的多轨录音,您需要更快的协议,尤其是如果您打算以高比特深度和采样率录音,因此我们将探讨它们的优缺点。

数字音频制作中最基本的组件是模拟/数字/数字/模拟转换器。ADC/DAC 就是您如何将模拟音频输入和输出到电脑的方式。它将麦克风或乐器产生的模拟信号转换为数字信号。然后它将数字信号转换为模拟信号以进行播放。ADC/DAC 有多种形式:最低端、最便宜的板载声卡有一个,当然高端音频接口也是如此。有各种 USB 和 FireWire 录音接口,可以将麦克风和乐器连接到电脑上,而且您根本不需要担心内置声卡。还有小巧便携的 ADC/DAC,可以连接唱盘、卡式录音机和立体声音响放大器到电脑上,以及内置 USB ADC/DAC 的 USB 麦克风和唱盘。对于预算充足的录音室爱好者,还有更昂贵的机架式 ADC/DAC。

一个录音室示例

让我们从一张基本、中等质量的计算机录音室的照片开始,碰巧这是我自己的。图 2-1 显示了整个系统:电脑在桌子下面。从左到右是各种耳机;然后桌子上有一个外置 USB CD/DVD 刻录机、一个四端口供电 USB 集线器、一个液晶显示器、一台彩色打印机、至关重要的热饮杯、一台唱盘、一台优秀的先锋立体声音响放大器、一台 Behringer 供电混音器和一台 MobilePre USB 前级/模拟/数字转换器。前面有两只动圈麦克风。未显示的是一对安装在墙上的漂亮的 JBL 扬声器。您可以在一个小空间内塞进很多功能。

我的小小录音帝国(麦克风实际上并没有放在放大器和调音台前面;那只是为了拍照摆的姿势)

图 2-1.我的小小录音帝国(麦克风实际上并没有放在放大器和调音台前面;那只是为了拍照摆的姿势)

同样没有展示的是一款优秀的 Focusrite Saffire Pro 26 I/O FireWire 多通道录音接口。Focusrite 制造出色的音频硬件,并支持 Linux、Mac 和 Windows。我们将在第九章(第九章)中看到更多关于 Saffire 的内容。

这就是它们如何组合在一起:

  • 录音:麦克风和乐器 > Behringer 混音器 > MobilePre > 电脑

  • 播放:电脑 > MobilePre > 先锋立体声功放 > 扬声器

对于录音,Behringer 混音器有一对 RCA 录音输出。这些通过 RCA 配对到两个 1/4 英寸单声道 TRS 适配器发送立体声信号到 MobilePre 上的两个 1/4 英寸 TRS 插座。MobilePre 通过 USB 线缆连接到电脑。然后 Behringer 上所有插入的设备都会被 Audacity 捕获。

注意

连接器的术语有些混乱,所以我将把电缆上的连接器称为 插头,把混音器、预放大器、放大器等它们插入的插座称为 插座。我还会遵循惯例,即使这对我来说听起来很奇怪,也会提到 连接器。至少 连接器有精确的含义,不像很多音频术语那样模糊。

对于播放,MobilePre 拥有 1/8 英寸立体声输出。这可以通过立体声迷你插头到 RCA 配对适配器连接到先锋功放的辅助输入。MobilePre 还有一对 1/4 英寸 TRS 输出,因此对于这些输出,我需要 1/4 英寸 TRS 到 RCA 适配器。图 2-2 显示了放大器背面的插头。这样的放大器加上一个好的 ADC/DAC 可以成为一个转换工作室的绝佳中心,因为任何连接到放大器的设备都可以在电脑上录音。

这是一台珍贵的旧但多功能的先锋立体声放大器背面。它可以连接两个唱盘(它甚至为唱盘提供了合适的接地连接器),两个磁带机,一个麦克风,一个调谐器,另一个放大器,一个预放大器,以及一个 CD 播放器或其他输入设备的辅助连接器

图 2-2。这是一台珍贵的旧但多功能的先锋立体声放大器背面。它可以连接两个唱盘(它甚至为唱盘提供了合适的接地连接器),两个磁带机,一个麦克风,一个调谐器,另一个放大器,一个预放大器,以及一个 CD 播放器或其他输入设备的辅助连接器。

我也可以完全去掉 Behringer,例如用于采访和播客,只使用 MobilePre 与任何电脑结合。

当我复制黑胶唱片到 CD 时,过程是这样的:

  • 录音:唱盘 > 先锋功放 > MobilePre > 电脑

  • 播放:电脑 > MobilePre > 先锋功放 > 扬声器

黑胶唱机连接到放大器上的唱机端口。放大器通过一对录音输出连接到 MobilePre。我可以使用 RCA 对到两个 1/4 英寸 TRS 适配器或 RCA 对到立体声迷你插头,因为 MobilePre 在连接方面非常灵活。

您可以使用这种设置将任何旧媒体数字化,因为连接到您的 Hi-Fi 放大器或接收器的任何设备都可以复制到您的电脑中。

录音和回放都通过 MobilePre 进行路由,所以我可以在好的扬声器上听到回放,而不是低音质的电脑扬声器。MobilePre 有一个耳机插孔,可以在录音时进行零延迟监听,这是一个很棒的功能。Behringer 混音器(Europower 1280S)并不是真正打算用作录音室混音器;它是用于供电现场表演的,它在这方面做得非常出色,因为它是一个集成的混音器和 1200 瓦的放大器。当我录制现场表演时,我会用笔记本电脑和 MobilePre 连接到它。我还有一个 Zoom H2 便携式数字录音机,可以用它代替笔记本电脑和 MobilePre。现场表演中最好的录音来自直接连接到混音器板。

注意

我喜欢听和录制的当地老式乡村乐队有一个相当古怪的声音系统。他们有一个不错的公共广播系统,但不是将每个人都连接到混音器板,只有歌手的麦克风连接到混音器。所有的音乐家都必须自带乐器放大器。这使得舞台显得杂乱无章,录音也变得噩梦般——将录音机插入混音器意味着它只能听到麦克风拾取到的任何乐器。Zoom H2 有一个小巧的适配器,可以安装在麦克风支架上,这样我就可以将其放置在任何位置,但它并不如一个通过声音板路由的完整设置好。

让我们更仔细地看看 MobilePre,因为它代表了许多 USB 录音接口。MobilePre 为电容式麦克风提供 48v 幻象电源,并具有 XLR 和 TRS 插孔、1/8 英寸立体声输入、两个 1/4 英寸单声道输出和一个 1/8 英寸零延迟耳机插孔用于监听。只要它们有 XLR 连接器,动态和电容式麦克风都可以插入 XLR 插孔。您还可以使用 XLR 到 TRS 适配器将动态麦克风插入 1/4 英寸输入之一。其内置 ADC 支持从 8kHz 到 48kHz 的采样率,以 16 位进行采样,并从您电脑的 USB 总线获取电源,因此不需要自己的电源线。它具有物理增益控制旋钮和耳机音量控制旋钮,因此您不需要在软件控制上浪费时间。(我宁愿转动旋钮,也不愿在某个奇怪的软件界面上摸索。)您应该可以在 150 美元以下找到它。在 16 位/48MHz 的最大录音质量下,它正在变得过时,因为类似设备支持 24 位录音。尽管如此,它是一个很棒的设备,因为它符合 USB 1.1 类规范,所以可以在任何电脑上运行,无需特殊驱动程序。

图 2-3 和 图 2-4 展示了 MobilePre 的正面和背面。

M-Audio MobilePre,正面。从左到右:通道 1 1/4 英寸单声道 TRS 插孔,通道 1 和 2 增益控制,削波 LED,耳机插孔,耳机音量旋钮,幻象电源开关,幻象电源 LED 和电源 LED

图 2-3。M-Audio MobilePre,正面。从左到右:通道 1 1/4 英寸单声道 TRS 插孔,通道 1 和 2 增益控制,削波 LED,耳机插孔,耳机音量旋钮,幻象电源开关,幻象电源 LED 和电源 LED

M-Audio MobilePre,背面。从左到右:USB 插孔,立体声线路输出,1/4 英寸单声道 TRS 左右输出,立体声麦克风输入,通道 2 1/4 英寸单声道 TRS 输入,通道 2 XLR 麦克风插孔,通道 1 XLR 麦克风插孔

图 2-4。M-Audio MobilePre,背面。从左到右:USB 插孔,立体声线路输出,1/4 英寸单声道 TRS 左右输出,立体声麦克风输入,通道 2 1/4 英寸单声道 TRS 输入,通道 2 XLR 麦克风插孔,通道 1 XLR 麦克风插孔

排列连接器

TRS 和 XLR 这些术语是从哪里来的?TRS 是tip-ring-sleeve,这是 TRS 插头的物理描述。图 2-5 是立体声和单声道 TRS 插孔的标记照片。

XLR 的起源要复杂一些。Cannon Electric 是 XLR 连接器的原始制造商,一些老一辈的人仍然称它为cannon plug。它最初是“Cannon X”系列的连接器。后来版本增加了锁定装置,因此有L,然后接触点被橡胶封装,形成R。图 2-6 展示了一对三针 XLR 插头。

一个立体声 1/4 英寸 TRS 插头(左)和一个单声道(右)

图 2-5。一个立体声 1/4 英寸 TRS 插头(左)和一个单声道(右)。

这里是一个三针公 XLR 插头和一个三针母 XLR 插头。

图 2-6。这里是一个三针公 XLR 插头和一个三针母 XLR 插头。

图 2-7 展示了一系列插头和适配器。你可以找到适配器来使任何设备与任何设备兼容。然而,你必须小心——仅仅因为某物可以安装并不意味着它应该在那里,所以请阅读你的产品手册。立体声 TRS 插头在尖端附近有两个黑色条纹,而单声道 TRS 插头有一个。

两个立体声 RCA 到 1/8 英寸 TRS 插头,1/4 英寸单声道 TRS 到两个立体声 RCA,1/8 英寸到 1/4 英寸立体声 TRS 适配器,1/4 英寸到 1/8 英寸单声道 TRS 适配器

图 2-7. 两个立体声 RCA 到 1/8 英寸 TRS 插头,1/4 英寸单声道 TRS 到两个立体声 RCA,1/8 英寸到 1/4 英寸立体声 TRS 适配器,1/4 英寸到 1/8 英寸单声道 TRS 适配器

Behringer 动圈麦克风展示其三针公 XLR 连接器

图 2-8. Behringer 动圈麦克风展示其三针公 XLR 连接器

图 2-8 展示了 Behringer 动圈麦克风上的三针公 XLR 连接器。

多声道录音,PCI,USB,FireWire

多声道录音可以通过几种不同的方式进行。一种方式是使用简单的双轨录音接口,如 MobilePre。它一次最多支持六个输入,并将它们路由到两个通道。没有混音控制,因此在录音时需要一些调整以获得良好的平衡。使用像 Pre 这样的双通道接口进行多声道录音的更好方法是同时录制两个轨道,为每个乐器或表演者分配其自己的独立轨道,而不是试图一次性将它们全部通过 Pre。然后 Audacity 就是你的混音器,你可以对每个轨道进行单独控制。另一个双通道录音的选项是高质量的 Emu 1616M PCI 双通道 PCI 声卡,你可以在 200 美元以下的价格找到二手的。它附带一个支持各种插件的分线盒,24 位/192 千赫录音,幻象电源和前置放大器。

当我有更多的朋友来录音时,我的 Behringer 1280S 就会派上用场。只要你有 ADC/DAC 可以连接到它,任何模拟调音台都可以使用。我的设置有点像“黑客”作业,因为 Behringer 并不是真正的录音室调音台,但它工作得很好,听起来也不错,这是在音频的广阔世界中一点小创意就能走得很远的例子。像许多调音台一样,Behringer 输出到双声道立体声,所以我需要在录音时调整好混音——在 Audacity 中我只有两个通道可以工作。我也可以一次用 Behringer 录制一到两条音轨,然后在 Audacity 中将它们拼接起来;没有规定说你必须一次连接所有设备。(尽管管理和组织音乐家可能有点像牧羊,有时你必须接受你能得到的任何东西。)

从版本 1.3.8 开始,Audacity 支持一次录制与你的录音接口支持的音轨数量一样多。旧版本的最大值为 16。这就是 FireWire 和高端 PCI 声卡发光的地方,因为它们允许一次录制多个音轨。Focusrite Saffire Pro 40 是一款大约 500 美元的 FireWire 录音接口中的好价值,它提供了 8 个话筒前级放大器,总共 20 个输入和 20 个输出,24/96 录音,闪烁的 LED 灯,以及每个话筒通道的幻象电源。M-Audio Delta 1010 是一款流行的多通道 PCI 声卡,它连接到一个机架式分线盒。它的价格大约为 600 美元。

一系列酷炫的新设备是 USB 和 FireWire 调音台。这些设备将所有功能集成在一个设备中——前级放大器、幻象电源、调音台板、ADC/DAC,以及直接连接到你的电脑。在 300 到 1000 美元的价格范围内有很多不错的选择。Behringer 的 Xenyx USB 调音台系列价格在 150 到 600 美元之间。它们使用符合标准的 USB 1.1,因此可以插入任何电脑,无需特殊驱动程序。M-Audio NRV10 是一款价格约为 700 美元的不错的 FireWire 调音台/前级放大器。

如何选择使用哪一种?USB 和 FireWire 都是便携式且易于连接的。PCI Express 是最快的。PCI-E 的单条通道同时双向传输大约 250MBps。这是 250 兆字节,而不是兆比特。普通的 PCI 最大传输速度为 133MBps。此外,与 PCI-E 不同,PCI 使用共享总线,因此更多的 PCI 设备意味着更多的带宽竞争。每个 PCI-E 设备都有自己的专用数据管道,所以 PCI-E 设备不需要共享带宽。USB 1.1 的传输速率为 12Mbps(每秒兆比特),而 USB 2.0 的传输速率约为 480Mbps,但这两个数字都是高度理论化的,在现实生活中你很可能只能得到一半的速度。FireWire 的传输速率为 400Mbps。然而,FireWire 提供的持续传输速率和性能优于 USB,这一点将在下一节中更详细地讨论。

内置声卡的常见问题是会从电脑机箱内的硬盘、电源和风扇中拾取噪音和电气干扰。这通常不是像 Emu、M-Audio 和 RME Hammerfall 这样的优质声卡的问题,但对于消费级和游戏级声卡以及低预算的板载声卡来说,这往往是一个更大的问题。如果你遇到了噪音,首先要检查的是所有连接——确保一切连接正确,并且需要接地的部分都已接地。有时将 PCI 卡移动到不同的插槽可能会有所帮助。查看你的主板手册,看看你是否拥有共享的 PCI 插槽;如果你知道另一个插槽已被占用,那么不要使用共享插槽。

USB 还是 FireWire?

如果你喜欢 USB 音频接口的便利性,你也可能考虑 FireWire 设备。你如何选择 FireWire 或 USB?USB 设备通常比 FireWire 便宜,但代价是性能可能较差,因为两种协议之间的差异。

所有 FireWire 接口都有特殊的控制器芯片,因此它们不会给你的电脑 CPU 增加任何额外的负载。FireWire 是一种对等协议,这意味着 FireWire 设备在不需要主机 CPU 周期的情况下协商总线冲突。FireWire 为你提供了两种操作模式可供选择:异步或同步。异步模式意味着设备可以保留一定部分带宽完全用于自身,其他设备无法使用。因此没有冲突,这转化为高持续吞吐量。

如果你的 PC 没有 FireWire 接口,添加一个也很容易。PCI FireWire 接口大约需要 50 美元,许多笔记本电脑都包括 FireWire 端口。当你购买 FireWire 音频接口时,务必检查硬件兼容性。例如,Presonus FP10 与某些视频芯片组存在已知冲突,并且它只与有限数量的 FireWire 接口兼容得很好。

FireWire 的未来

“FireWire 要完蛋了!”是最近常见的呼声。这可能是真的,尽管它还将与我们相伴数年。USB 2.0 据说具有与 FireWire 性能相媲美的潜力,而 USB 3.0 据说将超越它。音频硬件制造商在发布 USB 2.0 录音接口方面进展缓慢,尽管现在已经有了一些值得尊重的产品。其中许多依赖于非 USB 2.0 兼容的自定义驱动程序,所以购买时请仔细检查,以免购买到无法在电脑上运行的设备。USB 3.0 仍在开发中,音频硬件制造商并不以快速行动著称。如果你喜欢 FireWire 录音设备,那么请毫不犹豫地购买并使用它们,如果 FireWire 最终变得过时,你仍然可以使用你的设备,因为没有人会来把它从你那里拿走。

USB 仅在异步模式下运行。异步意味着同一总线上任何设备都可以随时发送数据,因此有时会有冲突,这会导致延迟。USB 依赖于主机,并给 CPU 带来负担,这也可能导致延迟。延迟是高质量音频的敌人。

你会看到很多仍然使用 USB 1.1 的 USB 音频设备。USB 1.1 有两种速度:1.5Mbps 和 12Mbps。后者也称为全速。USB 录音接口不太可能降低到 1.5Mbps。你可以同时记录的通道数量取决于你想要记录的质量级别。CD 质量,两个通道的 16/44.1,比特率为 1,411,200Mbps。两个通道的 24/96 等于比特率为 4,608,000Mbps,所以看起来你可以一次记录四个 24/96 通道。然而,那个 12Mbps 的最大值是理论上的,你实际的世界吞吐量将是理论值的一半或更少。最可能的情况是,你最多只能进行两个通道的 24/96 录音。如果你小心谨慎,并且拥有一个性能良好、快速的多核 PC,并且将其调校用于音频制作,那么 16/44.1 或 24/48 的四个通道是可能的。(参见比特率、比特深度和文件大小以了解不同的比特率。)

USB 2.0 音频设备需要仔细挑选,因为其中许多设备不是 USB 类兼容的,而是提供自己的专用驱动程序。即使是 Windows 用户也必须做他们的作业,因为厂商发布新 Windows 版本时的驱动程序发布速度很慢。Mac 的整体支持是不错的,Linux、Unix 和其他平台上的用户通常处于落后地位。一些多轨 USB 2.0 设备获得了良好的评价。例如,M-Audio Fast Track Ultra 8R(八进八出)获得了高分,并且可以在 Mac、Linux 和 Windows 上运行。

麦克风

图 2-9 中的麦克风是中等价位的动圈麦克风,每个不到$100。麦克风非常重要——你不能从低质量的麦克风中获得好的录音。有两种常见的麦克风类型:电容式和动圈式。电容式麦克风具有更宽的频率响应,更敏感,输出更响亮,并且瞬态响应更快。瞬态响应是指任何突然的变化,例如鼓边击打,用力拨弦的吉他,或者歌手发出一些硬辅音(并且可能喷出一点唾沫)。

Audio-Technica 立体声电容麦克风,Behringer 动圈麦克风和风袋

图 2-9. Audio-Technica 立体声电容麦克风,Behringer 动圈麦克风和风袋

电容式麦克风需要电源。当它通过麦克风电缆传输时,这被称为幻象电源,因为没有单独的电源线。它们比动圈麦克风更脆弱。电容式麦克风主要存在于录音室中。它们也用于舞台上,与动圈麦克风一起在鼓组中使用;电容式麦克风悬挂在上方以捕捉钹和瞬态,而动圈麦克风则放置在鼓旁边。图 2-9 展示了 Audio-Technica 立体声电容式麦克风、Behringer 动圈麦克风和风标。(有经验的歌手知道要避免鲜艳的风标,因为它们看起来像小丑的鼻子。)

需要幻象电源的电容式麦克风通常使用 XLR 连接器。动圈麦克风既使用 XLR 连接器也使用 TRS 插头。动圈麦克风不需要幻象电源,所以在将其插入幻象电源 XLR 插孔之前,请确保幻象电源已关闭。这不会损坏麦克风,但会改变其声音。在音频设备上看到这两种类型的麦克风连接器是很常见的,而较新的设备则具有可以接受两种连接器的组合插孔。

在图 2-9 中展示的小型 Audio-Technica Pro 24 立体声电容式麦克风是一种不同类型的电容式麦克风。它由一个小型水银电池供电,内置电缆,并可以插入任何 1/8 英寸 TRS 立体声麦克风插孔,例如笔记本电脑、数字录音机和摄像机。

有两种类型的电容式麦克风:大振膜(LDM)和小振膜(SDM)。它们都能在其整个频率范围内均匀且准确地记录声音,尽管 LDMs 因其“更温暖”的声音而享有盛誉。大振膜麦克风在低频范围上比小振膜麦克风表现更好,但同类型的小振膜麦克风在高频响应上更佳。低音被描述为更温暖,而高音则被描述为更冷且更明亮。你将听到各种对声音品质的描述:温暖、寒冷、脆弱、柔和、坚硬、明亮、暗淡,等等。相信自己的感知,不要担心别人告诉你应该喜欢什么。

现代 AEA R84 动圈麦克风

图 2-10. 现代 AEA R84 动圈麦克风

动圈麦克风具有较窄的频率响应,并且不如电容式麦克风准确。它们坚固耐用,防潮,不需要电源供应,因此动圈麦克风常用于舞台和现场。动圈麦克风通常覆盖人类语音范围再加上一点,这使得它们非常适合歌手。

另一种值得考虑的麦克风类型是带式麦克风,这是一种动圈麦克风。带式麦克风的内部结构是在磁场中悬挂的金属带。这些麦克风价格昂贵,但因其清晰度、空间深度和真实性而备受推崇。它们在 20 世纪 30 年代彻底改变了音频行业;带式麦克风为真实性和准确性设定了新的标准,当时的电容麦克风无法匹敌。随着电容麦克风和动圈麦克风的改进,带式麦克风逐渐失去了人气。它们价格昂贵,金属带脆弱,输出信号非常低,需要比其他类型的麦克风更多的放大。现代带式麦克风更实惠、耐用,并且比它们的祖先产生更大的输出,因此它们绝对值得一试(图 2-10)。

话筒带式麦克风是原生的双向麦克风,这意味着它们对麦克风前后两侧的声音都敏感,以八字形模式。它们在阻挡来自两侧的声音方面非常有效。八字形模式位于水平轴上,因此你可以将它们倾斜以获得不同的效果。将一对匹配的带式麦克风以 90 度角并排放置称为布卢门林对,或交叉八字形。这可以创建一个逼真的立体声图像。如果你不想捕捉来自一侧的声音,例如观众一侧,你必须以某种方式阻挡它或找到具有所需捕捉模式的带式麦克风。

极化模式

对于麦克风来说,重要的考虑因素是极化模式。极化模式描述了麦克风的灵敏度区域,如图 2-11 所示。这些二维图表并没有显示极化模式是三维的,所以请记住,它们不是平坦和水平的;它们包括具有高度和深度的区域。

一些常见的麦克风极化模式(图片来源:由维基百科用户 Galak76 创建,GFDL 许可发布)

图 2-11. 一些常见的麦克风极化模式(图片来源:由维基百科用户 Galak76 创建,GFDL 许可发布)

这些是常见的极化模式:

心形

从前面拾取声音,从后面拒绝声音。次心形麦克风与全向性类似,但后部的范围较小。超心形和超心形麦克风在前面有更窄的范围,以及后部灵敏度的小瓣。这在舞台麦克风和尤其是歌手的麦克风上很常见。不同的心形麦克风有不同的灵敏度水平。有些麦克风拾音范围较宽,因此适合活动范围较大的表演者,而有些麦克风灵敏度区域较小,因此更擅长不拾取背景噪音。

全向性

在球形区域内从所有方向均匀拾取声音。尝试将你的乐队围成一个圈,中间放置一个全向麦克风,以获得宽敞、自然的声音。

长枪式

所有麦克风中最具方向性的,前端长而窄,后端拾音范围较小。这些通常与各种电影摄像机一起使用,从电影到数字,从专业到消费级,都是野生动物摄影师的首选。

双向

从前后方向都能很好地拾取声音;不会拾取侧面的声音。(图 2-11"))中没有展示。)

半全向,或半球形

捕获大约 180 度的半球形区域。使用这种麦克风之一,你可以录制一些很好的现场录音,因为它具有宽阔的前端拾音区域,并且不会拾取后方的噪音。(图 2-11"))中没有展示。)

你可能会想,为什么不直接使用长枪式或心形麦克风来录制所有内容,以便只专注于你想要录制的声音呢?做你想做的;让你的耳朵和品味成为你的指南,并根据场合选择你的麦克风。不同品牌和型号的麦克风具有不同水平和类型的灵敏度。例如,有些麦克风对活动频繁的歌手比较宽容,而有些麦克风只有在近距离时才能很好地捕捉。无线耳机非常适合精力充沛的表演者,无线麦克风意味着没有绊倒电缆的风险。有些麦克风随着你靠近会更多地强调低频,就像广播 DJ 那样夸张地强调低音。这被称为 近讲效应

牛仔摇滚乐队 Trinity Session 的专辑是使用一个据说价值约 9000 美元的单个 环绕声 麦克风录制的。环绕声指的是旨在产生逼真、空间自然的环绕声录制技术和设备。环绕声麦克风具有多个胶囊,可以捕捉来自不同方向的声音,从四个到几十个不等。这是音频制作中的一个有趣细分市场;如果你对了解更多感兴趣,可以查找 环绕声SoundField 麦克风

哪种麦克风适用于哪种场合?

适用于各种场合的麦克风种类繁多,例如用于人声、吉他、鼓等。歌手们可能会特别挑剔,因为不同的麦克风会对他们的声音产生不同的色彩。你会在这一主题上发现许多热情的观点。请记住,有许多因素会影响录音对你来说听起来有多好:编辑方式、你正在听到的设备类型、你的听音位置(家、朋友家、音乐厅、户外、车辆)、你的情绪和期望。我们从小听着各种类型的录音音频长大:赛璐珞、黑胶、不同类型的磁带,现在则是数字录音。所以,什么听起来“正确”很大程度上取决于我们习惯听到的声音。有些人仍然怀念着 60 年代那种刺耳的 AM 广播或轰鸣的自动点唱机,或者立体声八轨磁带的声音。有些人认为黑胶听起来比数字录音“更温暖”,而电子管放大器听起来比固态放大器更温暖。

我一直想做一些盲测,看看我生活中的那些挑剔的音响爱好者是否真的能听到区别。我最想做的盲测是电子管放大器与固态放大器的对比,以及冷态电子管放大器与经过 24 小时预热后的电子管放大器的对比,因为一些上述挑剔的音响爱好者坚持认为电子管放大器需要长时间的预热期,否则听起来会“冷”。

电子管和固态之间确实存在真正的差异。电子管放大器系统驱动变压器,变压器再驱动扬声器。变压器抑制了许多瞬态,如尖峰、噼啪声和咔哒声,从而产生更干净的声音。冷态前置放大器比热态前置放大器噪声更多。电子管也有一个独特的噪声源,而半导体设备有多个噪声源,这增加了你可能会听到的噪声量。然而,在高质量的设备上,要检测到差异需要非常敏锐的听力。

定义一个“纯粹”的体验几乎是不可能的,因为即使是现场表演也会受到环境和设备、氛围以及我们大脑处理数据方式的影响。我总是惊讶于我喜欢的本地乐队在我的表演录音中听起来有多糟糕。在表演期间,我玩得很开心,觉得他们听起来很棒。然后后来当我听到回放时,我听到了各种各样的缺陷:节奏不准确、音准不对、缺乏活力,等等。也许我太挑剔了,太专注于在录音中寻找错误;也许在现场表演时,我的大脑太忙于玩乐,而没有注意到缺陷。也许我录制的录音很糟糕。

道理是,音质取决于你自己的耳朵和经验——对你来说什么听起来好和正确才是最重要的。你可以尝试追求最逼真的保真度,或者尝试追求最佳的艺术和创意保真度。这一切都是主观的。

麦克风电缆

市面上有众多品牌的麦克风线缆,你可能会在某个高调的品牌名上浪费很多钱。不必花费大量金钱;有许多价格合理、质量上乘的选择。你可能会对平衡非平衡线缆感到困惑。在连接麦克风的情况下,非平衡线缆是一种以 TS(针-套)连接器结束的同轴电缆。它由一根被组合屏蔽和接地线包围的单导线组成。这些线缆能有效屏蔽外部干扰,但容易受到感应杂音和噪声的影响,通常比平衡线缆更嘈杂。平衡线缆以三针 XLR 连接器或 TRS 连接器结束。它有两根内部线,一根热线和一根冷线,被一个不构成信号路径的屏蔽包围,因此提供更干净的信号。平衡线缆可以比非平衡线缆运行更长的距离而不会拾取过多的噪声。

请记住,是信号本身是平衡的还是非平衡的,使用平衡线缆并不能使非平衡信号变得平衡。然而,TS 线缆会将平衡信号转换为非平衡信号。你需要根据你的麦克风、前级放大器、放大器、调音台或你可能要插入的任何设备来匹配你的线缆。依赖幻象电源的电容式麦克风很可能使用三针 XLR 平衡线缆,而动圈麦克风则使用带有 XLR 和 TRS 连接器的平衡线缆。平衡信号不关心它所携带的内容,因此你可以根据需要使用 XLR 到 TRS 适配器,只要插入的设备发送正确的信号。

这些天,这不应该是一件需要花费大量时间解决的问题,因为大多数现代音频设备都支持平衡麦克风连接。

麦克风线缆要么是硬的,要么是软的,这取决于它们将被用于何处。软线缆适用于现场表演,而硬线缆通常位于录音室中,那里它们不太经常移动。

如果可能的话,不要将任何音频线缆与电力线交叉,因为你可能会有干扰。如果必须这样做,请以直角交叉以减少重叠。

智能麦克风使用

将你的麦克风放置以获得最佳效果本身就是一门艺术,而要精通它,唯一的途径是大量练习。你希望尽可能靠近,但又不能太靠近以至于拾取电子干扰或歌手不希望的声音,如唇音和唾沫。对于歌手来说,泡沫过滤器很有帮助,而防风罩对于户外录音是必不可少的。

“3-1 规则”是一个简单的指南,用于现场表演或在录音棚中放置麦克风,当时你同时在同一房间内设置了多个麦克风和表演者。当麦克风放置得太近时,你可能会得到尖叫声、凹陷和峰值,或其他形式的令人不快的干扰。3-1 规则意味着相邻麦克风之间的距离应该是麦克风与声源之间距离的大约三倍。如果有多个放大器存在,就像我喜欢的当地乐队,每个表演者都带着自己的放大器上台,这些也会造成问题。有时只需将放大器转向不同的方向,就可以解决反馈问题。

麦克风支架是必不可少的——不要依赖手持。鹅颈支架占用空间较小,调整速度快,但时间久了会磨损。三脚架支架可以永久使用,但占用空间较大。有些人更喜欢三脚架脚,但我总是绊倒,所以我更喜欢带重量的底座。减震架和笼子可以很好地隔离你的麦克风免受振动,而且价格不贵。

麦克风前置放大器

麦克风前置放大器是音频链中第二重要的设备,仅次于 ADC/DAC。正如我在本章中已经讨论过的,我有一个 M-Audio MobilePre 和一个 Focusrite Saffire Pro 26。有了这些,我就不需要内置计算机声卡或单独的前置放大器,因为它们都有自己的内置麦克风前置放大器。然而,即使你更喜欢使用内置声卡或拥有良好的外部录音接口,你也可能仍然想使用单独的麦克风前置放大器。让我们谈谈为什么前置放大器如此重要。

前置放大器——简称preamplifier——放大低电平信号到线路电平。麦克风、唱机以及许多乐器拾音器的输出低于线路电平。线路电平是一种标准模拟音频信号电压,旨在连接不同的音频组件。这个电压是多少?嗯,这是一个好问题,因为尽管它被宣传为标准电压,但它取决于制造商。大多数在 1 到 2 伏特之间。前置放大器对音频质量有显著影响:低质量的前置放大器会引入噪声和失真。一个好的前置放大器可以干净地放大信号,不会引入缺陷或色彩。

注意

音频术语以各种方式被曲解——你看到的许多家用高保真系统前置放大器并不像麦克风前置放大器,因为它们不做任何放大,只是切换单元,你可以在其中插入所有设备。

预放大器从仅提供增益(放大)和幻象电源的简单模型到装饰华丽、充满各种特殊效果、旋钮和闪烁灯光的设备。许多音频设备都配备了大量的特殊效果,因为添加它们几乎不花什么钱,而且它们让你感觉像是在得到一些特别的东西。如果你喜欢很多特殊效果,这是一个很好的额外好处;只是不要让它分散你对设备真实质量的注意力。至少,有一些物理旋钮是很好的。关于哪种预放大器最好的争论几乎具有宗教性质。专业人士可能会在单个预放大器上花费数千美元。你可以这样做,但在我看来,你最好从廉价的设备开始,投资于完善你的录音技巧。然后当你准备好升级到更好的设备时,你会欣赏这种差异,并知道如何充分利用它。

扬声器和耳机

在你的音频链中同时拥有扬声器和耳机,让你能够以不同的方式听到你的录音。专业监听扬声器据说非常平坦和准确,不会添加任何自己的色彩。它们也往往很贵。我自己的录音室扬声器是一套很好的 JBL 三分频扬声器。它们不是真正的专业监听扬声器,只是我喜欢的好扬声器。耳机是必不可少的——你需要这些来监听你的录音。内置零延迟耳机端口的音频接口非常适合监听。我似乎收集耳机:我有一款很好的 Plantronics USB 耳机,非常适合录制播客;一套带有普通 1/4 英寸 TRS 插头的 Sennheiser 耳机;还有无线 Audio-Technica 耳机。我的录音室扬声器由一款很好的先锋 SA 7500 立体声放大器供电。我已经修过两次,我会尽量让它继续工作。它的每个通道功率为 45 瓦,听起来并不多,但它以一些严重的电流来驱动这些瓦特。功率放大器是放大器中真正的功率衡量标准;这就是微弱放大器和强大清洁放大器之间的区别。瓦数并不代表太多——这只是销售人员喜欢关注的数字。

这些都不是超级超级的高保真,至少不是按照挑剔的音响发烧友的标准,但它们都是好的组件,并且让我感到满意。

你的电脑必须拥有肌肉和巨大的抽屉

你的电脑应该是一台功能强大的现代机器,拥有高性能的 CPU 和大量的 RAM。我的录音室 PC 配备了一个 AMD Phenom 三核 CPU 和 4GB RAM。多核 CPU 有很大的影响。单核 CPU 对于双轨录音和像播客和采访这样的简单录音应该表现良好。例如,我有一台老式的 ThinkPad,CPU 为 800 MHz,RAM 为 256MB,运行 Linux,作为采访现场录音机表现良好。对于超过两轨的情况,多核是最佳选择。不用担心 AMD 与 Intel 之间的区别;它们都很好,所以使用你最喜欢的那一个。

你需要尽可能多的存储空间。CD 品质的音频(44.1 kHz,16-bit WAV)每分钟每轨大约占用 5MB。别忘了把所有你使用的轨和重录的轨加起来。你可以购买 TB 级硬盘,等你读到这段话的时候,它们可能容量更大了。另一个选择是将多个硬盘的容量组合在一个 RAID(廉价磁盘冗余阵列)中。对音频制作有用的两种 RAID 级别是 RAID 0 和 RAID 10。RAID 0,也称为条带化,使得两个硬盘看起来像一个,所以两个 500GB 的硬盘看起来就像一个 TB 的硬盘。RAID 0 非常快,但和单个硬盘一样有同样的弱点——如果阵列中的任何一个硬盘失败,你可能会丢失所有数据。

RAID 10(使用高质量的硬件控制器)是镜像加上条带化,因此你既得到速度又得到冗余。使用高质量的硬件控制器;你不想使用一些便宜的控制器,它会给 CPU 带来更多负载,而应该使用能够自己处理负载的控制器。它的磁盘成本比流行的 RAID 5 要高,但它更可靠,速度也更快——你得到更快的读写速度,以及从失败的硬盘恢复得更快。我不会使用 RAID 5 或 6 阵列进行音频录音;实际上,我再也不使用它们了,因为它们太脆弱,写操作太慢,并且容易传播校验错误。

我不会担心为使用 Audacity 进行录音和编辑而构建一个超级 RAID 阵列,除非你发现自己一直在消耗 TB 级的硬盘。我在我的工作室 PC 上使用一个单独的大硬盘,对文件管理非常严格,并且会删除不需要的文件。我使用一个很棒的四个硬盘的 Linux 驱动 RAID 10 服务器进行备份。

操作系统

在这本书中,我将涵盖 Linux 和 Windows。每个系统都有其优势和陷阱。如果你是 Windows 用户,尽管 Vista 和 Windows 7 已经发布,XP 仍然是最可靠的版本。你将获得最好的硬件和软件支持以及最佳的性能。Vista 由于其自身的高硬件要求而带来特殊问题——它可能会让你的系统变得缓慢到无法舒适地进行音频录音,而且许多音频设备的驱动程序支持还不成熟。音频硬件制造商似乎对 Windows 7 更感兴趣,但与 XP 相比,它仍然很占用资源。如果你想从 XP 升级,不要考虑 Vista;直接升级到 Windows 7。如果你的音频硬件和软件在 XP 上运行良好,那么尽可能长时间地保留它们。

Linux 用户在硬件制造商面前往往感到烦恼,无论他们购买多少产品,进行多少炒作,提供多少免费支持,这些制造商都假装他们不存在。附录 A 将告诉你在 Linux 中哪些设备工作良好,你还会找到链接到提供 Linux 音频硬件支持最新信息的网站。如果这能给你一些安慰,许多音频硬件供应商也没有发布很好的 Windows 驱动程序。为什么?谁知道;这是一个我浪费太多时间去思考的谜团。他们难道不希望顾客满意吗?

延迟是高质量音频的敌人,因此请参考第十三章和第十四章以获取调整操作系统以获得最佳音频性能的建议。

这里列出了 Audacity 文档中的系统要求。假设 Windows 7 与 Vista 相同:

Windows 98, ME

推荐配置为 128MB/500 MHz,最低配置为 64MB/300 MHz

Windows 2000, XP

推荐配置为 512MB/1 GHz,最低配置为 128MB/300 MHz

Windows Vista Home Basic

推荐配置为 2GB/1 GHz,最低配置为 512MB/1 GHz

Windows Vista Home Premium/Business/Ultimate

推荐配置为 4GB/2 GHz,最低配置为 1GB/1 GHz

Linux

“Audacity 在至少 64MB RAM 和 300 MHz 处理器上运行最佳,”Audacity 为 Linux 用户的文档中提到。我建议播客、访谈和双轨音乐录音的最低配置为 800 MHz CPU 和 256MB RAM,而对于多轨录音和编辑,我建议您购买最强大的三核或四核 CPU。

便携式录音

有几种很好的现场录音方法。我最喜欢的两种是将笔记本电脑改装成便携式录音室,或者使用便携式数字录音机。笔记本电脑非常酷;自从我发现电脑以来,我就一直希望能有笔记本电脑。普通笔记本电脑也可以工作得很好,而且你会有更强大的 CPU。你拥有与台式计算机相同的所有选项——你的选择包括前级放大器、调音台和其他音频接口、麦克风、软件——你可以在现场完成所有编辑工作,甚至刻录 CD。你还有一个很好的屏幕和键盘,而不是便携式数字录音机上的小屏幕和小按钮。

袖珍式数字录音机工作得非常好,而且很有趣。这些设备从微小的钥匙扣大小的录音设备,相当于音频便签,到用于高质量语音录音的小型录音机,再到高质量的多通道录音机。让我们看看一个高质量录音设备都包含哪些内容。

使用 RCA-to-1/8″立体声插头适配器连接到调音台或其他任何双通道立体声 RCA 录音或线路输出的 Zoom H2

图 2-12. 使用 RCA-to-1/8″立体声插头适配器连接到调音台或其他任何双通道立体声 RCA 录音或线路输出的 Zoom H2

有大量价格合理的设备,你可以把它塞进口袋,随时随地携带。携带额外的电池和一些额外的存储卡,你就准备好应对任何情况了。我个人最喜欢的设备是 Zoom Handy H2 (图 2-12). 它使用两节 AA 电池,并且还配有交流适配器。它配备了四个内置的高质量麦克风,因此你可以选择以双通道立体声或四通道环绕声进行录音。它没有扬声器,但附带耳机,也可以用作电脑上的 USB 音频接口。它的 1/8 英寸线路输入可以直接连接到音乐会的音响板,并且它也接受外部麦克风。它使用 SD 卡进行存储,支持 WAV 和 MP3 文件格式。它的价格大约为 150 美元。

一些其他受欢迎且优秀的便携式数字录音机包括 Olympus LS10、Marantz PMD 620、Marantz PMD 660、Sony PCM-D50、Yamaha Pocketrak 2G 和 Zoom H4。所有这些设备的价格都低于 600 美元,并且都内置了麦克风。理想情况下,你能在购买之前亲自试用它们,因为它们有一个共同的弱点——小巧的 LCD 控制面板和复杂的菜单。你还需要测试噪音水平,因为有些设备在使用内置麦克风时很安静,但使用外部麦克风时却很嘈杂。大多数设备都接受外部麦克风——有些只有 1/8 英寸迷你插孔,有些则接受全尺寸 XLR 或 TRS 插头。那些有 XLR 插头的设备并不总是为电容式麦克风提供幻象电源。一个不错的选择是使用电池供电的电容式麦克风,这样你就不必担心幻象电源了。

注意

提供幻象电源的设备通常会宣传“48v 幻象电源”。但很少有麦克风实际上使用 48 伏。它们通常使用更少的电压——少至 8 到 10 伏。

还有一些其他事项需要考虑,比如电池寿命、存储卡类型和大小。它是否有内置存储,支持哪些音频文件格式?它是否附带有用的配件,如交流适配器、防风罩、耳机和支架?

一个有趣的变体是 M-Audio Micro Track II。它没有内置麦克风,但是一个微型双通道录音室,旨在与高质量的外部麦克风一起使用。它支持动圈麦克风和电容麦克风,并为电容麦克风提供完整的 48v 幻象电源。

我更喜欢使用 USB 卡读卡器将文件从便携式录音机传输到我的电脑。通常这更快,而且不会耗尽录音机的电池。

录制自己出色音频的秘诀

制作高质量音频录音的“秘密”并不是什么秘密:最重要的因素是阻挡不想要的噪音。我们的大脑很擅长忽略我们不想要注意到的声音,但麦克风对所有的噪音都给予同样的关注。阻挡不想要的噪音比听起来要困难,因为我们的现代世界非常嘈杂:车辆交通、飞机、家用电器、电视和立体声音响、荧光灯、价值 2000 美元的 120 分贝的功率超低音扬声器在价值 500 美元的汽车中穿梭,建筑工地等等。高频噪音比低频声音更容易阻挡,正如我们都知道的,我们试图逃离那些四轮动力超低音扬声器的徒劳尝试,它们穿过所有障碍物。

计算机也会产生自己的声音——硬盘和风扇噪音是很常见的。所以在你购买昂贵的录音设备之前,首要任务是准备你的录音室:

  • 使用一个安静、有吸音墙壁或墙面的房间。旧地毯和毯子与昂贵的吸音泡沫一样有效。

  • 将一个好的定向麦克风靠近你要录制的任何东西,并仔细对准。

  • 保护你的麦克风远离你的电脑。

  • 小心调整你的音量,既不要太低也不要太高。

  • 将麦克风安装在减震笼中。

但是,你可能要问,为什么要费那么大的劲?为什么不在之后修复?毕竟,这只是一些软件问题。我亲爱的读者,如果像愚蠢的电视节目和电影所描绘的那样简单,那就没有必要有隔音的音乐录音室,也不会有人大喊“现场安静!”你可以在 Audacity 中多少减轻一些问题,但最好的结果是尽可能制作出高质量的录音,并将修复问题留给那些无法避免的问题。这根本不像犯罪节目那样,顶尖的音频技术人员可以清理任何录音,无论多么混乱,以达到完美的音质。这已经超出了虚构,进入了幻想。

听力范围

生活在所谓原始社会的人们,没有我们所有的现代“便利设施”,他们的听力依然敏锐,直到老年。我想,如果他们想要制作音频记录,就不必那么努力地阻挡不想要的背景噪音。

据报道,美洲印第安人和澳大利亚的土著人的听力范围是 10 Hz 到 25 kHz。普通人的听力范围大约是 32 Hz 到 18 kHz。这本书的优秀技术审稿人阿尔文·山羊的听力范围扩展到大约 22 kHz。但这并不像听起来那么酷,因为大多数高于 18 kHz 的声音都是噪音:风扇、电源供应、扬声器失真等等。他有时因为所有额外的声音掩盖了其他人说话而被指责听力不好。

戈登·赫普顿是一位自称为声音追踪者的杰出艺术家(www.soundtracker.com/)。赫普顿先生将职业生涯致力于录制纯粹的自然声音,其中不包含任何人类的声音。在 1992 年,他记录了全球的黎明合唱声。在后来的岁月里,他根据马克·吐温的著作录制了密西西比河的声音,根据约翰·缪尔的著作录制了约塞米蒂国家公园的声音。他使用一个名为弗里茨的 Neumann KU-81i 假人头( Dummy Head)来尽可能地模拟我们听到的声音。他已经发布了一系列高质量的 CD,让你能够听到一个没有噪音人群的世界听起来是什么样子。

赫普顿先生在 20 世纪 80 年代初开始了他的录音生涯。当时他录制的许多地点现在都太嘈杂,无法录音。

你的 PC 应该专门用于这项工作,不要用于其他任何事情,无论是游戏、上网、发电子邮件还是其他任何事情,因为你希望你的电脑的全部功率都用于录音。如果你不这样做,你可能会产生跳音和卡顿。关闭屏幕保护程序、所有电源管理以及任何防病毒或反恶意软件软件。(Windows 用户,我需要说吗,在这样做之后不要连接到互联网?)关闭所有不必要的服务、计划任务以及所有非必要的事物。

你的麦克风会从出人意料的多处拾取噪音、振动和干扰。如果你仍然有一个老式的阴极射线管(CRT)显示器,请将其更换为现代的平面薄膜晶体管液晶显示器(TFT-LCD),因为 CRT 会发出辐射和噪音。有时它们甚至会与某些声音产生共鸣并产生回声。

你可以通过将一块地毯固定在一块胶合板或颗粒板上,以低廉的成本在麦克风和电脑之间建立一个有效的声音屏障。给它装上脚,让它自己站立,你就拥有了昂贵的高科技声音屏障的一部分。笔记本电脑和台式机都应该放在非共振表面上。在紧急情况下,你可以将笔记本电脑放在一件外套或一个枕头上,同时注意不要阻塞其散热通风口。

不要吸烟

吸烟对你的健康有害,对电脑和音频设备,尤其是麦克风来说也很糟糕。对访问你的工作室的人来说,这也很糟糕——他们可能不会欣赏吸二手烟,并在离开后淋浴和换衣服。

尽管许多指南建议将你的工作室尽可能做成声学上“死”的,没有任何回声或共振,但请随意实验。你可能喜欢某些东西在具有一些硬质表面的空间中的声音。心理声学在专业录音室中发挥作用;它们不会制作完美的无回声室,因为那些地方太平,听起来不愉快。没有声音反射,没有任何给声音增加深度的事物。因此,专业录音室在保留声音深度的同时减少随机噪音。

参考附录 A

Layla 和 Firecracker 等待他们的指示

图 2-13. Layla 和 Firecracker 等待他们的指示

现在您对所需内容有了些想法,请访问附录 A,了解各个价格范围内的优质音频设备。这应该有助于您在庞大的、绚丽的音频硬件世界中导航。

Layla 和 Firecracker,官方工作室的狗狗,祝您好运 (图 2-13).

第三章。将黑胶唱片(及其他旧式媒体)转移到 CD

无标题图片

保存和欣赏旧录音的一个好方法是将它们从任何旧式媒体——黑胶唱片、磁带、开盘磁带、复古 78 转盘、录像带,甚至八轨磁带——转移到 CD。或者,您可以将它们转移到硬盘、固态硬盘或您偏好的任何数字存储介质上。

将唱片转移到 CD 的需求很大,您甚至可能通过这种方式获得一份不错的副业。许多人仍然保留着他们的唱片收藏,但害怕去欣赏它们,因为黑胶唱片很脆弱。许多优秀的专辑从未在商业 CD 上发行,或者现代 CD 重制做得不好。有些人只是更喜欢他们旧唱片的音质。

虽然您可以复制任何模拟媒体并将其转换为任何数字音频格式,但本章我们将主要讨论将黑胶唱片专辑和单曲转移到 CD。一旦您将旧模拟媒体转换为数字格式,Audacity 就有许多工具可以用来改善音质。您可能无法总是进行完美的修复,但可以将嘶嘶声、点击声、爆裂声和其他缺陷减少到相当可容忍的水平。

您还可以自定义动态范围压缩以满足您的需求,这是一个很好的功能,因为在现代流行 CD 中,动态范围压缩被过度使用,以至于它破坏了音乐。即使他们做得很好,也可能不适合您,所以 Audacity 让您按自己的方式来做。

最后,我们将讨论黑胶唱片与 CD 以及其他媒体的优势,以及如何将您的各种播放设备连接到电脑的细节。如果您需要帮助设置硬件,请先跳转到将旧式设备连接到您的电脑。

对于那些对 16/44.1 CD 不满意的“金耳朵”们,DVD-Audio 格式支持高达 24/196。没错,每秒 196,000 个采样,24 位。DVD-Audio 支持 5.1 环绕声,Audacity 在 1.3.x版本中也支持。如果您不感兴趣环绕声,您可以将相当于几个 CD 的音乐以 16/44.1 的格式压缩到一张 DVD 上。我们将在第六章中学习如何制作 DVD-Audio 光盘。

好了,那么让我们深入探讨复制、编辑,然后制作 CD。如果您需要复习 Audacity 的基本使用方法,请查阅第一章。

准备黑胶唱片进行复制

首先,尽可能清洁你的黑胶唱片。当然,你可以做很多事情来清理数字音频文件,但那不像电视上的情景,那里的顶尖实验室技术人员可以轻松地完成完美的修复。亲爱的读者们,那只是虚构,我们身处现实世界。最好从尽可能高质量的录音开始;这样工作量更小,而且你得到的结果更好。

我有我那些来自旧时代的 Discwasher 刷子,这很好,因为新的那些质量较差。真正的 Discwasher 刷子有一个定向绒毛——用一种方式清洁唱片,然后在干净的、无绒毛的布上反转你的刷动来清洁刷子。手柄上有一个箭头,指向刷子的前端。你可以干着使用真正的 Discwasher 刷子,或者用它来湿式清洁。用 Discwasher 湿式清洁的正确方法是只将清洁剂涂抹在刷子的前端,其余部分保持干燥。你可以在唱片机上旋转唱片的同时清洁它,但要注意不要施加过多的压力,以免损坏电机。用湿的前端刷子旋转三到四次,然后滚动刷子,让干燥的部分与唱片接触另外三到四次。在播放之前给它足够的时间完全干燥,因为播放湿唱片可能会损坏它。(然而,对于已经处于糟糕状态、无甚可失的唱片,湿着播放可能会让它听起来更好。用蒸馏水或 Discwasher D4 液体小心地湿润它,然后旋转一下。这不会损坏你的唱针。)

对于日常清洁来说,拥有一把碳抗静电刷是个不错的选择。这些刷子总是干着使用,并且很擅长清除灰尘、绒毛和其他试图在你的唱片上安家的颗粒。但它们不适合清洁指纹、粘稠的胶状物或其他需要湿性清洁剂的污渍。

有各种各样的清洁剂、超细纤维布、刷子,甚至湿式高压清洗机。关于如何清洁黑胶唱片的最佳方法的争论是无穷无尽的,声音也很响亮;我将把这个任务留给你,自己做功课,找出你更喜欢的方法。你可以在二手店里以便宜的价格买到一些脏兮兮的、无甚可失的唱片来练习。鉴于关于什么最有效的各种说法,我怀疑黑胶唱片比我们想象的要坚固。

唱片制作的历史

最早的录音是在旋转的蜡质圆柱体上进行的,圆柱体中间有一个针,这个针连接到一个振动的膜片,并附在一个喇叭上,就像一个老式的耳号角。喇叭的功能就像麦克风。针的振动在蜡上切割出不均匀的凹槽。现代单声道录音使用的是同样的原理,即振动的针切割较软的材料,只是这次针是由磁铁驱动的。

当有人实验磁针相对于针尖的角度时,立体声就出现了。他们发现这可以被精确控制到足以切割沟槽的每一侧,从而创建两个立体声通道。即使 CD 和数字音频的出现,生产乙烯基唱片的工艺也在不断改进,一些唱片公司仍在生产高质量的乙烯基录音。有了所有这些进步,录音和播放两个通道仍然是由一个针尖完成的,这导致了一些串扰,因此需要精确调整你的唱盘以获得最佳性能。

注意

永远不要在复古 78 转/分钟唱片或任何醋酸或非乙烯基唱片上使用任何类型的酒精,因为这会损坏它们。最早的唱片是由蜡制成的,使用了巴西棕榈蜡、蜂蜡和其他许多不同的蜡质。了解这些的人建议根本不要使用液体清洁剂。如果你有复古唱片,我建议咨询了解如何安全处理它们的专家。含有酒精的溶液适用于现代乙烯基唱片,大多数唱片清洁剂都含有酒精。无论你使用什么清洁剂,都必须是那种不会留下残留物的。

你还应该投资购买一个唱针刷和清洁剂,因为唱针上会积累污垢。这一点不太有争议;我使用 Stanton SC-4 刷和清洁剂,它们的工作效果很好。记住,当你处理唱盘的唱针时,你不可能太小心;只能通过其安装支架轻轻地处理它。永远不要用手指触摸它。

使用唱针量规调整唱针的垂直循迹力。高品质的唱头只需要 0.5 到 3 克。中等品质的唱针,以及为 DJ 设计的唱针,可以达到 5 克。根据你特定硬件的说明设置循迹力。太轻或太重都会造成过多的磨损,所以你真的需要调整得恰到好处。

根据你的唱盘和唱臂,你可能还需要调整防滑、垂直循迹角度和方位角。你的唱盘说明书应该会告诉你这些是什么以及如何调整它们。目的是在不造成不对称磨损的情况下,正确对准接触点。花些时间调整你的唱盘是值得的,你可能会惊讶于微小的调整能带来多大的差异。

将唱片转换为 CD 的八步法

首先,让我们列出所有步骤,然后在下一节中详细说明。复古唱片需要一些特殊处理,我们将在复制复古 78 转盘中讨论,在复制复古 78 转盘。如果您不知道如何连接您的唱机,请先访问将旧式设备连接到您的计算机。以下是需要遵循的步骤:

  1. 在选择工具栏中将 Audacity 的帧率设置为 CDDA 帧。

  2. 将项目速率设置为 32 位浮点/44.1 或 16/44.1。

  3. 将您的专辑复制到 Audacity 中,作为一个长轨道。

  4. 进行任何修复,例如去除噪音和爆裂声,归一化,压缩和删除不必要的部分。

  5. 输入元数据。

  6. 将 Audacity 轨道导出为 CD 准备音频文件。

  7. 使用您喜欢的 CD 刻录软件将歌曲复制到 CD 上。

  8. 将您的新 CD 放入播放器并享受。

最耗时的部分是修复缺陷。本章提供了一些常见修复的技巧,并且第十二章完全致力于修复和清理。

我喜欢将单轨录音的方式与步骤 3 略有不同:我更喜欢将每首单轨录音到其自己的轨道中,使其看起来像图 3-1。

将每首歌曲放入单独的 Audacity 轨道

图 3-1。将每首歌曲放入单独的 Audacity 轨道

使用每个轨道上的“跟踪”菜单输入歌曲标题作为轨道名称。在导出时,当所有轨道都导出为 CD 准备文件时,每个文件将采用轨道名称。

使用单个 Audacity 轨道的每个单独的优势在于更容易重新排序它们,并且您可以在一次操作中调整音量级别。当所有歌曲都在一个轨道上时,归一化不会将安静的歌曲提升到与响亮歌曲相同的音量。任何差异都必须逐首歌曲进行纠正。但是当多个轨道归一化时,它们都会在一步之内提升到相同的音量级别。

Audacity 设置

首先,如图 3-2 所示,在选择工具栏中设置 CD 音频的正确帧率。这确保了您所做的任何分割都将从 CD 帧开始和结束。任何落在这些帧之外的音频将会丢失,并可能产生点击噪音。您可以选择 hh:mm:ss + CDDA 帧(75 fps)或 CDDA 帧(75 fps)。前者显示时间加上 CD 帧,后者仅显示 CD 帧。勾选“吸附到”框以确保停止和开始总是在 CD 帧边界上。

设置 CD 音频的正确帧率

图 3-2. 设置 CD 音频的正确帧率

然后在 编辑>首选项>质量 对话框中设置您的质量首选项为采样率为 44,100 Hz 和 32 位浮点数位深。红皮书 CD 音频标准是 16/44.1,但如果您有足够的磁盘空间,以 32 位浮点数工作有许多优点。它提供了最大的动态范围,这意味着更少的噪声和大量的编辑空间,因此您可以进行大量的处理而不会损失质量。

如果您想节省磁盘空间,特别是如果您正在进行最小编辑的直接复制,以 16/44.1 录音是可行的。您进行的操作越多,以 32 位浮点数工作就越好。

当您在首选项菜单中时,也要查看这些选项:

  • 在录音选项卡上,取消选中“叠加:录音新曲目时播放其他轨道”和“软件回放:录音或监控新曲目时收听。”

  • 在导入/导出选项卡上,选中“导出前显示元数据编辑器。”

  • 确保录音通道数设置正确(设备选项卡),这是双声道立体声。即使是老式的单声道黑胶唱片也使用两条轨道。

录音

然后点击 文件 >另存为项目 并给你的项目命名,启动你的唱机,并设置你的录音电平。你有足够的动态范围,所以给自己留出一些空间以避免削波。使用 32 位浮点数位深意味着您可以记录到 -24 dB 的峰值,并且仍然比您的硬件能使用的动态范围更大;我通常记录到 -9 dB 的峰值,因为唱片不像现场表演那样不可预测。如果它突然出现一个超级响亮的段落让我惊讶,我可以轻松地重新录制它。点击 视图 >显示削波,Audacity 将用亮红色的线条突出显示任何削波。

然后点击 记录 按钮并开始播放您的唱片。除了在翻到第二面之前放松并享受音乐之外,没有太多的事情要做。点击 暂停 按钮在翻唱片时暂停录音。每次您点击 记录 时,它都会开始一个新的轨道,所以使用 暂停 来保持同一轨道的连续性。如果您不小心按了 停止,您可以使用 shift-Record 将其附加到现有轨道上。

记录一些噪声是个好主意,比如在音乐开始之前和音乐停止之后的唱片开头和结尾,这样您可以在之后进行有效的噪声消除。一个没有音乐的纯噪声样本最佳。将其保存在单独的轨道上。

修复缺陷

首先进行粗略修剪,删除任何不需要的部分。不要剪得太紧,但要留下一些额外的空间,然后稍后再进行最后的修饰。修剪掉轨道中不需要的部分很容易;只需选择你不需要的部分,然后按删除键,或者点击剪切按钮。另一种删除的方法是选择你想要保留的部分,然后点击修剪按钮。这会保留你的选择并删除其余部分。

删除轨道的一部分会使它变短,有时你可能不想这样做,而是想保持相同的长度。通过静音而不是删除来实现这一点——选择你想要去除的部分,然后点击静音按钮。这会使它变为静音而不是删除它,并且你的轨道长度保持不变。

下一步是修复任何削波或划痕。缺陷只存在于一个通道中是很常见的情况。这更符合黑胶唱片的特点,因为唱针被凹槽推动,所以推动唱针向内的那一侧磨损更严重。磁带也会不均匀磨损,因为一条轨道位于远离磁带边缘的“内侧”。最靠近边缘的轨道会受到磁性、电场和磁带导轨造成的物理损伤的影响最大。

注意

轨道的定义有点模糊。音频轨道是一个单声道轨道或双声道立体声轨道,或者它是一个长轨道上单首歌曲。

要修复只有一个通道的缺陷,请在轨道面板中使用分割立体声轨道命令将你的立体声轨道拆分成两个单独的轨道。然后你可以分别编辑每一个,完成编辑后,你可以使用制作立体声轨道将它们重新组合。将它们分开的一个好处是,未损坏的轨道可以掩盖另一个轨道中不太完美的修复。

你知道你可以插入静音吗?如果你需要填充一个轨道并使其变长一点,或者你需要插入一个无声的间隔,首先点击标记你想要插入静音的位置。然后点击生成 > 静音,输入你想要多长时间,然后点击确定。新的静音部分将被插入到你的标记右侧。图 3-3 展示了如何创建两秒的静音。注意,它包含一个下拉菜单,就像选择工具栏一样,有所有不同类型的值可供使用:秒、小时/分钟/秒、不同的帧率等等。

插入两秒的静音

图 3-3. 插入两秒的静音

淡入,淡出

在录音中,淡入和淡出被广泛使用。在图 3-4 中,我删除了一段冗长的无聊掌声,并留下大约三秒的间隔,然后我使用包络工具优雅地淡出至静音,然后再淡入。包络工具为你提供了对淡入淡出和音量级别的很大控制。那些小白点是控制节点。通过点击任何位置创建新的节点,将它们拖动到任何方向以提升或降低音量,将它们拖出轨道边界以删除它们。包络工具在几乎所有音频编辑应用中都是标准的。

使用包络工具淡入至静音,然后返回正常

图 3-4. 使用包络工具淡入至静音,然后返回正常

另一种应用淡入淡出的方法是使用效果 > 淡出淡入。选择你想要淡入或淡出的音频部分,点击效果 > 淡出淡入,它将自动为你应用一个优雅、均匀的淡入或淡出效果。你只能控制淡入或淡出的长度。

一些 CD 刻录应用会在音频轨道之间自动创建两秒的间隔,所以请注意。你可能不希望在现场表演中的歌曲之间有间隔,或者不希望在 Audacity 中创建的音频中添加间隔。好的 CD 刻录应用允许你控制这种行为。

修复扭曲

Audacity 无法修复扭曲的唱片。高质量的唱机比低成本唱机更准确地跟踪扭曲的唱片。许多教程建议通过小心加热唱片以软化它来平整扭曲——在烤箱中、在阳光明媚的窗户旁、在温暖的车辆中——然后将它放入干净的纸套中,并放在重物下面。我尝试过温暖车辆的方法,因为使用烤箱的想法让我感到害怕,而且如果你小心且挑剔地保持一切清洁,有时效果很好。将碎片压入柔软、温暖的乙烯基上不会改善它。

你可以使用 Audacity 减轻扭曲唱片产生的某些不良声音,如点击声、噼啪声和嘶嘶声;请参阅下一节。

修复跳音和噼啪声

你可以通过查看波形图来很容易地找到由划痕或扭曲引起的任何跳音或爆音,如图 3-5 所示。它们表现为突然的、细长的峰值。“效果 > 点击移除”在批量移除点击而不移除音乐方面相当不错。它寻找波形中典型的由划痕引起的爆音的峰值,删除划痕,然后进行一些插值以重建波形。选择阈值设置决定了判断峰值是否为划痕的灵敏度。较小的选择阈值值更敏感,而较大的值则不太敏感。灵敏度过高意味着你可能想要保留的东西可能会被识别为点击并移除,例如一些打击乐效果。

光标线左侧的区域位于歌曲之间,应该是相对平坦的,但这个例子来自一张有很多小划痕的唱片,所以你看到很多突然的、细长的峰值。

图 3-5。光标线左侧的区域位于歌曲之间,应该是相对平坦的,但这个例子来自一张有很多小划痕的唱片,所以你看到很多突然的、细长的峰值。

最大峰值宽度值决定了点击移除工具将移除的段的最大长度,以毫秒(ms)为单位。默认值为 20 ms,这比大多数划痕都要长。

选择带有一些划痕的轨道的小段,并尝试一些试错,这得益于点击移除效果的预览按钮而变得迅速。听听预览,如果听起来不对,更改设置并再次尝试。默认设置相当不错,一旦你对设置调整到满意,就可以将其应用到整个轨道上。

注意

默认预览长度为三秒。如果太短,请打开编辑 > 首选项 > 播放 > 预览长度对话框并使其更长。

你可能想手动修复点击或爆音,特别是如果只有几个的话。这不会花费很长时间。一种方法是选择效果 > 放大并将其降低到-50 dB,这将使其静音。另一种方法是使用修复工具,它更为精确。放大直到你可以看到单个样本,选择要操作的段,然后点击效果 > 修复。修复工具在最多 128 个样本上操作。就像点击移除工具一样,它使用插值来减少和平滑修复段的边缘,因此不会留下间隙。(图 3-6 显示了修复前后的效果。)

使用修复工具前后修复一些削波的情况

图 3-6. 使用修复工具前后修复一些削波

注意

记住缩放工具——你可以放大波形足够大,以便看到单个样本,并给自己留出足够的空间进行精确编辑。当你放大或缩小视图时,点击以在轨道上标记你的位置,缩放工具将自动将视图中心对准你的标记。

寻找和修复削波

使用视图 > 显示削波快速查找任何削波片段。当你的录音音量超过 0 dB 时,就会发生削波。在数字音频中,削波很糟糕,因为它会导致失真。修复短暂削波片段的一个简单方法是使用放大效果。放大并仔细选择削波片段,然后选择效果 > 放大以降低一个或两个等级。放大设置使用负值,例如-3.0。分贝大约是我们能感知的最小变化级别,每 3 分贝将音量翻倍,或者当减少振幅时,将音量级别减半。所以-3 dB 是 0 dB 的一半,-6 dB 是-3 dB 的一半。超过几秒钟的削波段落应该重新录制。

噪音消除

即使在最好的系统上,黑胶 LP 唱片也永远不会完全无声。总是有一些背景噪音:嘶嘶声、转盘嗡嗡声、来自静电或压印缺陷的微小刮擦声。打开效果 > 噪音消除效果以消除这种不需要的噪音。它并不完美,并且在去除噪音而不对音乐造成太多损害之间总是存在权衡。当你有一个好的噪音配置文件,并且噪音与你想保留的内容明显不同时,效果最好。

首先,你需要建立一个你想要去除的噪音的配置文件,因此选择你轨道上只有噪音的几秒钟,例如在唱针在唱片上移动但不在音乐上时唱片非常开始或结束的地方。噪音样本越长越好,从 5 秒到大约 30 秒。选择你的噪音样本,然后在效果 > 噪音消除对话框中,点击获取噪音配置文件按钮。接下来,选择你想要应用噪音消除的片段,然后点击确定。你可以使用预览按钮确保在点击确定之前它正在正确执行。尽可能精确地应用噪音消除以最小化副作用。嘶嘶声、 wow 和 flutter、嗡嗡声和低级刮擦声都是常见的缺陷,如果你有一个好的干净噪音样本,噪音消除工具效果很好。

如果你不喜欢结果,请按 ctrl-Z 撤销,更改一些设置,然后再次尝试。默认的噪声降低级别是-24 dB,这意味着被识别为噪声的片段会被衰减-24 dB。如果这移除了录音中的太多内容,请降低此值并再次尝试。一种经常有效的方法是回到你的噪声样本,将其幅度降低几 dB,创建一个新的配置文件,然后再次尝试。你不想完全消除噪声,因为这可能会消除你想要保留的东西,只需将其降低到不烦扰的程度即可。

当你将频率平滑和攻击/衰减时间滑块向左移动时,它们会更加激进;而在刻度右侧则不那么激进。频率平滑的值越大,意味着它将更广泛的频率范围视为相同,因此会进行更大的变化。攻击是指音符敲击的力度,而衰减是指音符消失所需的时间。由于只有一个攻击/衰减时间滑块,攻击和衰减时间将始终相同。较小的值更突然,而较大的值则更平缓。

另一个巧妙的技巧是使用均衡器效果(见第十一章)通过降低 500 Hz 以下和 15,000 Hz 以上的频率幅度来减少嘶嘶声或隆隆声。当然,这也会影响你想要保留的这个范围内的任何声音,所以这并不总是最好的解决方案,但它是一个可以尝试的方法。你可以在包含不需要噪声的任何频率范围内尝试此方法。

限制频率范围的另一种方法是使用高通低通滤波器。高通滤波器阻止低频通过,允许高频通过,而低通滤波器则阻止高频。你可能需要安装一些插件来为 Audacity 获取高通和低通滤波器;查看你的效果菜单以了解系统上安装了哪些内容。(第十一章在改变速度中讲述了如何将压缩应用于你的录音。

标准化

现在你已经完成了修复,是时候为整个专辑调整音量了。如果你将所有内容复制到一个 Audacity 轨道中,选择整个轨道并应用效果 > 标准化。这不会影响动态范围或改变音频质量;它所做的只是提高整体音量水平。将最大振幅设置不超过 0.0,这是数字音频的最大值,并确保“移除任何直流偏移”被勾选。直流偏移指的是平均振幅。如果这不是零,那么标准化将不会正确应用,因为振幅级别将不平衡,甚至可能产生一些失真。当这一步完成后,你就可以继续下一部分了。

如果你将每首歌放入一个单独的 Audacity 轨道中,按 ctrl-A 选择所有轨道,然后应用标准化。然后跳转到导出为 CD 准备好的文件,多个 Audacity 轨道中的导出为 CD 准备好的文件,一个长的 Audacity 轨道。

将长轨道分割成单独的歌曲

如果你将所有内容复制到一个长轨道中,你可以将其导出为 16 位 WAV 文件,然后复制到 CD 上。但这样你将没有单独的歌曲;相反,你将得到一条没有歌曲切换方式的完整长轨道。所以,这里是将其分割成单独歌曲的方法。从最开始的地方开始;确保你正好在轨道的开始处,通过按 home 键来实现。然后按 ctrl-B。这将在你的专辑轨道下创建一个新的标签轨道,并且光标将位于一个小文本框内。将第一首歌的名字输入到这个小框中,然后按回车。然后点击你想要在第一首歌和第二首歌之间设置断点的地方,按 ctrl-B,并输入第二首歌的名字。继续这样做,直到所有歌曲都有它们的名称标签(图 3-7)。

将一条大轨道分割成单独的歌曲轨道并标记它们

图 3-7. 将一条大轨道分割成单独的歌曲轨道并标记它们

导出为 CD 准备好的文件,一个长的 Audacity 轨道

如果你已经将所有歌曲复制到一个长的 Audacity 轨道中,这是如何将它们导出为单独的 CD 准备好的音频文件的方法。首先打开文件 > 打开元数据编辑器,并输入专辑标题和艺术家名称,以及你想要在轨道元数据中保留的任何其他信息。留空轨道标题和轨道编号字段,因为 Audacity 会为你填写这些信息。

接下来,转到文件 > 导出多个并选择导出格式:WAV(微软)签名 16 位 PCM。您将看到一个类似图 3-8 的窗口。我建议导出到单独的目录,不要将导出文件与 Audacity 项目文件混合。选择“根据:标签”拆分文件”和“命名文件:使用标签/曲目名称”单选按钮。只有当您确定要替换同名旧文件时,才勾选“覆盖现有文件”框。点击确定,然后继续。

将每首歌曲导出为单独的、CD 就绪的音频文件,使用标签名称作为文件名

图 3-8。将每首歌曲导出为单独的 CD 就绪音频文件,使用标签名称作为文件名。

如果您像我建议的那样在编辑 > 首选项 > 导入/导出对话框中启用了“导出前显示元数据编辑器”,则元数据编辑器将在导出每首歌曲时出现。如果您不需要为每首歌曲审查元数据,可以将其关闭。

导出为 CD 就绪文件,多个 Audacity 轨道

如果您将每首歌曲复制到单独的 Audacity 轨道中,这就是您将它们导出为单独的 CD 就绪音频文件的方法。首先打开文件 > 打开元数据编辑器并输入所有曲目共有的信息,例如日期、流派或艺术家名称。留空曲目标题和曲目编号字段,因为 Audacity 会为您填写这些信息。

接下来,转到文件 > 导出多个并选择导出格式:WAV(微软)签名 16 位 PCM。您将看到一个类似图 3-9 的窗口。我建议使用单独的目录,不要将导出文件与 Audacity 项目文件混合。选择“根据:标签”拆分文件”和“命名文件:使用标签/曲目名称”单选按钮。只有当您确定要替换同名旧文件时,才勾选“覆盖现有文件”框。点击确定,然后继续。您将得到每首歌曲单独的文件,您创建的曲目名称将变成文件名。

将每首歌曲导出为单独的 CD 就绪音频文件,使用标签名称作为文件名。

图 3-9。将每首歌曲导出为单独的 CD 就绪音频文件,使用标签名称作为文件名。

将歌曲写入 CD

现在你有一批漂亮的单独的 WAV 文件,每个文件对应一首歌曲。使用你最喜欢的 CD 刻录应用将你的歌曲刻录到 CD 上,然后你就完成了。不要以最大速度刻录,而是将速度减半以确保你得到一张好盘。务必选择“新建音频项目”,或者你特定应用中制作音乐 CD 的任何名称,因为这会创建一个符合 Red Book 音频格式的 CD。不要制作普通的数据 CD,因为那样它将无法在标准 CD 播放器中播放,比如在你的车辆或高保真系统中。标准 CD 播放器无法播放 WAV 文件。(计算机 CD 播放器几乎可以处理任何东西,因为所有操作都是在软件媒体播放器中完成的。)

注意你的歌曲曲目顺序——你的 CD 刻录应用可能会按字母顺序而不是曲目顺序排列你的歌曲。如果你使用的 CD 刻录软件支持按日期排序,这是一个快速排序的方法,因为第一个导出的歌曲总是最老的,最后一个导出的歌曲是最新的。

如果你有一台支持在 CD 和 DVD 上打印的喷墨打印机,你可以购买专门用于打印的 CD 空白。这些 CD 空白有白色或银色的一面,设计用来容纳墨水且不会褪色。另一种新型可打印的 CD/DVD 需要一台特殊的热敏打印机,大约需要 100 美元。第三种可打印的磁盘类型称为LightScribe,需要一台特殊的 CD/DVD 刻录机。这些的价格与普通 CD/DVD 刻录机相当,大约 50 美元。

“我需要购买特殊的音频 CD 吗?”

这个经常被问到的问题的答案是:不需要。所有的 CD 都是完全相同类型的。一些国家会对“音频”CD 征收税费,声称这笔税费会支付给音乐家以补偿非法复制造成的收入损失。(如果他们实际上能公平地分得这笔税费的一部分,我会吃掉我最喜欢的黑胶唱片。)它们另一个特殊之处在于一个压印的数据标志,这是序列复制管理系统(SCMS)的一部分,用于控制受保护材料的复制。SCMS 编码控制三种状态:允许复制(00)、单次复制(11)和禁止复制(10)。它不会阻止你复制原始 CD。如果设置了“单次复制”标志,可能会干扰将副本放入连接到你的高保真系统的 CD 刻录机。计算机硬件和媒体不受强制执行 SCMS 的法律的约束。我使用普通的非音频 CD 空白,它们在所有 CD 播放器中都能正常工作。

复制复古 78 转唱片

复古 78 唱片 78s 是约从 1890 年代到 1950 年代末生产的旧式单声道留声机的简称。这些唱片也被称为短播放唱片和宽纹道唱片。直到 20 世纪 30 年代初,才真正有了行业标准,因此较老的唱片以 60 到 130 rpm 的速度播放。复古 78 唱片由虫胶混合染料、填料和其他材料制成,尺寸从直径 16 英寸不等。有些是层压的,如果受潮会分离。酒精会溶解虫胶,甚至过多的湿度也会对其造成损害。

演唱机黑胶唱片,无论是单声道还是立体声,转速为 33 1/3 rpm,单曲唱片转速为 45 rpm 或 78 rpm。是的,在很久以前,确实有 78 rpm 的单曲唱片;例如,这些在 20 世纪 60 年代初受到了迪士尼的青睐。您也可能找到一些 45 rpm 的黑胶唱片。这些唱片与复古 78 唱片的主要区别在于,它们是由乙烯基制成而不是虫胶,并且它们是在微纹道而非宽纹道上切割的。粗纹唱片需要 3 毫米的唱针,而微纹唱片使用 1 毫米的唱针。您可以使用现代立体声唱头和唱针播放旧的单声道黑胶唱片和单曲唱片,但不能播放复古唱片。有现代唱头和唱针是为播放这些旧唱片而制作的,例如流行的 Shure M78S。

我不是复古 78 唱片的专家,但如果您需要更多关于正确存储、处理和播放这些老式唱片的资料,网上和现实世界中都有很多优秀的资源。有许多复古留声机唱片专家、爱好者以及交易者,因此找到一些专家指导并不困难。

一旦您整理好所有硬件和安全的处理方法,在 Audacity 中您需要做一些不同的操作。打开编辑 > 首选项 > 设备对话框,将录音通道数设置为 1(单声道)。然后转到编辑 > 首选项 > 导入/导出,并选择“使用自定义混合”。这样做的原因是将您的单声道轨道混合到两个通道,这样您就可以在立体声系统的两个扬声器上听到音乐。如果您不这样做,您将只从一个扬声器获得回放。图 3-10 显示了 Audacity 的混音面板应该看起来是什么样子:将底部的滑块移动以创建两个输出通道,然后点击“音频轨道”(或您为您的轨道所取的任何名称)和“通道:2”以将它们链接在一起。

将单声道录音混合到两个通道以在立体声系统上播放

图 3-10. 将单声道录音混合到两个通道以在立体声系统上播放

将旧式设备连接到您的计算机

有几种方法可以将唱机和其他旧组件连接到电脑。首先让我们谈谈连接器。这些天,“插头、端口、插座”和“插孔”这些术语被随意使用。为了保持清晰和简单,我将把电缆和适配器上的连接器称为“插头”,而它们插入的东西(如放大器上的 RCA 和 TRS 插座)称为“插孔”。此外,为了尊重标准术语,我将根据性别来称呼插头和插孔,即公和母。这对于性别转换器尤为重要,它们是用于从一种连接类型转换到另一种连接类型的适配器。

在过去,每个人都使用 1/4 英寸(6.3 毫米)TRS 插头,生活很简单。然后制造商开始制造 1/8 英寸(3.5 毫米)迷你插孔和插头,以及更小的 3/32 英寸(2.5 毫米)微型迷你插头。你的设备是什么型号的没关系,因为总有适配器可以适应任何情况。实际上,带有迷你插头的设备通常包括 1/4 英寸适配器,你还可以获得适配器,可以将 1/4 英寸插头插入迷你插孔。只需确保你有正确匹配的适配器,无论是单声道还是立体声。单声道 TRS 插头有一个黑色绝缘环,而立体声插头有两个。

RCA 音频插头,幸运的是,它们和以前一样。RCA 插头有彩虹般丰富的颜色,每种颜色都有其含义:红色代表右声道,白色代表左声道或单声道,其他颜色用于不同的环绕声声道。它们都是一样的,所以使用“错误”的颜色也没关系。只有一个尺寸。它们也被称为唱机插头。图 2-7 在多声道录音,PCI,USB,FireWire 中展示了一系列 TRS 插孔、适配器、公 RCA 和母 RCA 连接器,以及一个双 RCA 到单立体声插头的适配器。适配器价格低廉,而且你总是需要它们,所以为各种场合准备一个抓包吧。

我最喜欢的将旧媒体数字化方法是连接一个立体声放大器或接收器到模拟-数字/数字-模拟转换器(ADC/DAC),然后它连接到电脑。然后所有连接到放大器的组件——唱机、磁带机、收音机调谐器、录像机、CD、DVD——都可以在 Audacity 中录制。(CD 和 DVD 可以直接在电脑上播放和复制;参见第五章了解如何进行此操作。)

您的电脑上可能已经有一个 ADC/DAC——您的电脑的声卡。如果它有一个线路输入端口,您应该使用它。这些是浅蓝色的 1/8 英寸立体声插头。根据您的功放或接收机,您应该有一对标准 RCA 输出可以连接到您的声卡,通常称为录音输出线路输出。翻回到图 2-2 在一个示例工作室中查看我珍爱的旧先锋放大器的背面。

因此,将我的功放连接到内部电脑声卡需要一个两 RCA 到 1/8 英寸立体声迷你插头适配器,如图 3-11 所示。

由于 1/8 英寸迷你插头的普及,这成为了许多转换工作室的工作马。

图 3-11. 由于 1/8 英寸迷你插头的普及,这成为了许多转换工作室的工作马。

在环绕声家庭影院接收机上,请查阅您的手册以确定最佳的录音输出。例如,我有一个 Onkyo 5.1 系统,配有一对 RCA 磁带输出,就像我旧先锋功放一样。您必须使用遥控器选择正确的输出通道,然后它会记录当前播放的内容。

我最喜欢的录音接口是 M-Audio MobilePre USB,它是一种麦克风预放器和 ADC/DAC 的组合。这取代了内部电脑声卡。MobilePre 支持多种不同的连接器,所以我可以使用两 RCA 到 1/8 英寸适配器或两 RCA 到两个 1/4 英寸 TRS 适配器,如图 3-12 所示。

一个两 RCA 到两个 1/4 英寸 TRS 适配器。注意,Y 适配器(右下角)在将 MobilePre 连接到放大器的录音输出时不需要。当需要为我的录音源使用耳机插孔时,Y 适配器很有用。

图 3-12. 一个两 RCA 到两个 1/4 英寸 TRS 适配器。注意,Y 适配器(右下角)在将 MobilePre 连接到放大器的录音输出时不需要。当需要为我的录音源使用耳机插孔时,Y 适配器很有用。

将唱机连接到您的电脑

除了通过连接到电脑的放大器连接之外,还有几种方法可以将唱机连接到电脑。一种流行的方法是使用 USB 唱机前置放大器,它允许你将任何唱机直接连接到电脑,即使是珍贵的旧唱机。实际上,你可能想寻找一个好的旧唱机而不是现代的,因为没有花费大量金钱很难匹配那些旧唱机的质量。你可以以便宜的价格购买到不错的 USB 唱机前置放大器,例如大约 100 美元的 ART USB Phono Plus V2。它包括增益控制、削波指示器、监控端口、USB 端口、RCA 输入和输出、光端口和 S/PDIF 端口。ADC/DAC 以 16/44.1 和 16/48 运行。它甚至包括唱机接地连接器,这对于有接地线的唱机来说是必不可少的。如果你不接地,你会得到一个讨厌的嗡嗡声。

你需要一个唱机前置放大器,而不仅仅是任何旧的前置放大器,因为唱机前置放大器应用 RIAA 均衡曲线校正。这非常重要。RIAA 均衡曲线是衰减黑胶唱片(500 Hz 以下)低频并提升 2,120 Hz 以上频率的行业标准。黑胶唱片必须以这种方式录制,否则低音凹槽将占据大部分专辑,导致播放时间短,高频几乎听不到。当你播放黑胶唱片时,你的集成放大器或接收器通过内置的唱机前置放大器纠正这种不平衡,RIAA 曲线被反转。听起来很尖锐,几乎没有低音,你可以通过关闭你的扬声器并将耳朵靠近唱针在唱片播放时听到这一点。

注意

放大器和接收器被称为集成的,因为前置放大器是内置的。接受独立前置放大器的放大器和接收器通常仍然具有集成前置放大器。在音频组件的奇怪世界中,你可能会为没有集成前置放大器或收音机调谐器的裸放大器支付更多费用。我见过的最昂贵的立体声放大器有一个完全空白的面板,上面只有一个电源开关、电源 LED 和音量旋钮。

RIAA 均衡曲线从大约 1955 年开始广泛采用,因此那时的唱片可能具有不同的均衡曲线。如果你想自己动手制作手工均衡校正,你可以在 Audacity 中这样做。Audacity 还有许多预制均衡曲线,例如哥伦比亚 LP、AES、德卡和 RCA。使用普通前置放大器而不是唱机前置放大器来获取未校正的信号,将你的专辑复制到 Audacity 中,然后应用你自己的均衡。图 3-13 显示了 Audacity 中的 RIAA 曲线均衡器的外观。

均衡器效果允许您以任何方式精细调整均衡器,并且支持创建自定义预设。

图 3-13。均衡器效果允许您以任何方式精细调整均衡器,并且支持创建自定义预设。

如前所述,将唱盘连接到录音接口的一个好方法是,以通常的方式将唱盘连接到您的立体声接收器或放大器,然后将接收器连接到计算机的录音接口。

另一个可以考虑的选项是购买带有内置唱头放大器的 USB 唱盘。随着越来越多的人想要尝试将他们的专辑转换成 CD,这些唱盘变得越来越受欢迎。这是一个很好的概念和便利性,但其中很多质量并不好,所以请仔细购物。

我的个人唱盘是 Audio-Technica AT-PL120。这不是一个甜蜜的几十年前的唱盘,而是一个带有自身内置唱头放大器的闪亮新直接驱动三速唱盘。没错,33 1/3、45 和 78。它设计成 DJ 唱盘,因此配备了椭圆形唱针,可以正向和反向播放唱片。(恐怖!好像我会对一张完美的黑胶唱片做那样的事情!)它具有可调节的速度、音调、防滑和脚轮调平器,而且重量大、结实,就像一个好的唱盘应该的那样。内部唱头放大器是可切换的,因此您可以将其直接连接到录音接口,或者关闭内部唱头放大器并连接到外部唱头放大器。如果您想播放复古 78 唱片,则需要购买特殊的唱头和唱针,例如 Shure M78S 宽沟单声道唱头。

注意

我们优秀的技术顾问 Alvin 指出,电台 DJ 使用直接驱动唱盘,这样他们就可以反向旋转: “您手动调整唱片,以便知道歌曲的开始位置,然后将唱片倒转四分之一圈。当您按下那些唱机上的“播放”按钮时,唱盘在四分之一圈处达到全速。”

图 3-14 展示了我家的个人设置。我既通过 M-Audio MobilePre USB 进行录音,也进行播放。

从右到左:漂亮的旧先锋立体声放大器、Audio Technica 三速唱盘、彩色打印机、M-Audio MobilePre、屏幕、耳机、嵌入回收的 E-Machine 机箱中的三核 CPU

图 3-14。从右到左:漂亮的旧先锋立体声放大器、Audio Technica 三速唱盘、彩色打印机、M-Audio MobilePre、屏幕、耳机、嵌入回收的 E-Machine 机箱中的三核 CPU

连接磁带录音机

磁带播放器可以直接连接到您的电脑。只需将它们的 RCA 输出插头通过适当的适配器连接到您的录音接口。您的录音接口可能已经配备了 RCA 输入。

哪个更好:黑胶唱片、磁带还是 CD?

关于哪种介质音质更好,黑胶唱片还是 CD,争论从未停止。我从小就一直是严肃的音乐爱好者,那时还是开盘磁带和黑胶唱片的年代。我的父亲是一位交响乐音乐家和音乐教师,时至今日,我不相信他认可过 18 世纪之后创作的任何音乐。(开个玩笑,爸爸!拥抱!)我认为 CD 是顶级的。

在 CD 出现之前,许多想要保存他们的黑胶唱片的音乐爱好者只会播放一张新黑胶唱片一次,以便将其复制到磁带上。由于它们的质量较差,购买商业录制的磁带是没有用的。他们使用最便宜的磁带,并受到嘶嘶声、狭窄的动态范围和整体糟糕音质的困扰。到 20 世纪 70 年代初,商业录制的开盘磁带基本上从市场上消失了,所以如果你想得到高质量的磁带录音,你必须自己制作。

对于不熟悉磁带和黑胶唱片读者来说,这可能听起来很麻烦,但这两种媒体都存在缺陷,并且没有一个能提供完全令人满意的解决方案。在黑胶唱片上跳过曲目更容易,而且它们比开盘磁带更容易处理,但几乎不可能保持它们干净且无损坏。它们都不存储很多音乐。一张黑胶唱片每面可以容纳 16 到 24 分钟;由于极端的低音震动,现代舞曲黑胶唱片每面只能容纳 12 分钟或更少。不要建议使用转盘换片器——那些是为喜欢损坏唱片的人准备的。一个 1200 英尺、7 英寸的 1/4 英寸磁带开盘,这在家庭录音中很常见,每面以 3.75 英寸每秒(ips)的速度可以存储 64 分钟,以 7.5 ips 的速度可以存储 32 分钟。(相比之下,专业录音是在 15 和 30 ips 的速度下进行的。)它们都不容易携带,而且不能在汽车中播放。

卡带彻底改变了家庭和便携式音频。它们在音质、便携性和成本之间做出了很好的妥协,而且比开盘录音机和黑胶唱片更加坚固耐用。你可以在任何地方停止卡带并从机器中取出它;而开盘录音机则很难做到这一点。家用市场的卡带以 1 7/8 ips 的速度运行,它们的磁带宽度为 0.15 英寸。音质并不等同于黑胶唱片和开盘录音机,但如果你有一个好的录音机和使用高质量的 II 型或 IV 型磁带,音质相当不错。每当我购买一辆新车(对我来说是新车),我做的第一件事就是给它装上一个好的音响系统。我喜欢长途旅行,因为喜欢去各种地方,而一大盒音乐磁带让这些旅行变得更加精彩。卡带有各种尺寸,我喜欢 90 分钟的卡带,因为一张磁带可以放两张黑胶唱片。带有自动倒带的立体声卡带播放器可以提供 180 分钟不间断的音乐。更大的尺寸,如 120 分钟的卡带,太薄太脆弱,不适合使用。较薄的磁带会拉伸;60 分钟的高品质磁带最厚,拉伸最少。

卡带录音机是音乐爱好者的救星。我和我的朋友们喜欢制作和交换混音磁带,因为即使在很久以前,商业广播也相当糟糕,只是反复播放同样的 20 大热门歌曲,广告比音乐多,而且 DJ 们会打断音乐。所以,交换混音磁带是发现新音乐的好方法。另一件酷事是我们可以复制我们想要的任何歌曲,而不用忍受那些困扰许多流行音乐的填充内容。鉴于音乐行业持续未能满足其客户的期望,它竟然还能存活下来,真是令人惊讶。大唱片公司的老板们应该每天感谢那些决心找到解决方案的客户,让他们能够享受商业制作的音乐,而不是完全放弃。

关于卡带的一个小贴士

阿尔文回忆说,磁带制造得非常宽和长:“最外缘和磁带的第一段和最后一段是最差的,用于最低级的音频磁带。更高等级的部分成为高质量音频磁带,最好的部分则成为计算机的数字磁带。正因为如此,你可以使用大多数计算机磁带进行音频,我就是这样做的。已经损坏的大型四分之一英寸盒式磁带(QIC)是出色的开盘录音机。我有一台古老的固态 Ampex 家用音频录音机,大约是 1969 年(晶体管,点对点布线,就像老式真空管一样)。没有降噪,1 7/8 英寸、3 3/4 英寸和 7 1/2 英寸的速度,使用 RadioShack 最便宜的磁带和最慢的速度,它的声音比卡带金属磁带和杜比 C 降噪更好。

卡带也被认为是传播西方流行音乐,尤其是朋克和摇滚音乐,到发展中国家和东欧国家的功臣。

对于卡式磁带,并没有太多的怀旧情绪。它们曾经有过作用,有些人仍然喜欢它们。但现在很难找到好的卡式磁带,因为制造质量已经下降。

磁带和乙烯基都不耐久。磁带是一种磁性介质,因此它可能被杂散的磁场破坏。磁带比乙烯基更不容易积聚灰尘和划痕,但两者都容易受到物理磨损。如果妥善处理和储存,它们可以持续数十年,但令人遗憾的是,你播放和享受它们的次数越多,它们磨损得就越严重。它们不会突然变得无法播放;它们倾向于首先丢失高频,随着时间的推移逐渐减弱,就像洗得太多次的衣物一样。

数字优势

黑胶唱片爱好者声称,它听起来更温暖,更真实,动态范围更广、更准确。CD 爱好者则认为,黑胶唱片爱好者怀念的是与播放黑胶唱片相关的所有氛围:唱机的声音、灰尘和划痕带来的表面噪音、翻面以听另一面,以及保持黑胶唱片良好状态所需的所有繁琐。我怀念那些与黑胶唱片一起来的封面艺术、海报和尺寸较大的小册子——你根本无法在小小的 CD 盒子里做太多。但无论你多么小心地保持黑胶唱片清洁、小心地处理它们、保持唱针清洁、保持音臂最佳平衡和跟踪,仅仅通过播放它们,就不可避免地会造成磨损甚至损坏,因为你在用摩氏硬度为 10 的钻石唱针在摩氏硬度为 1 的表面上刮擦。

一些黑胶唱片比其他保存得更好,因为它们的设计更精良。黑胶唱片最初是母带。这些母带被复制到金属或清漆制成的母盘上。刻录唱片是一项妥协的练习。安静的部分不能太安静,否则它们会在噪音中丢失,但如果太响,则沟槽会重叠并产生跳音。更大的音量也会导致播放时间减少,因此工程中的艺术性不亚于音乐本身。不幸的是,并非所有黑胶唱片都是同等质量。随着行业的成熟,对母带录音工程师提出了各种各样的要求,他们经常被告知母带还需要作为卡带的母带,并且为了广播而被破坏。乙烯基本身也变得更薄。换句话说,最低的共同标准显露出了平庸的一面。老黑胶唱片之所以受到喜爱,是因为它们制作得更好。

光盘拥有大部分的技术优势。数字音频最大的优势是复制件与原版相同。这在模拟音频中并不成立,模拟音频每一代都会丢失一些信息。当你得到一个复制件的复制件的复制件时,你就知道它与原版相去甚远。

CD 提供的动态范围高达 96 分贝,而最好的黑胶唱片可能只有 75 分贝,更常见的是 50 分贝左右。因此,CD 提供了更好的信噪比,以及即使是最好的黑胶系统也难以提供的绝对静音,即在静音段落中的绝对静音。诚然,这种绝对静音在很大程度上是理论上的,因为你的音频链中可能某处会创造一些声音——一点嗡嗡声,一点电气干扰——但 CD 本身是绝对静音的。如果设备足够好(这会使你成为一个罕见、富有和精英级的音响爱好者),黑胶在频率范围上胜出——它能够捕捉高达 70 到 75 千赫的频率,那里是蝙蝠飞行的区域。更常见的是,它落在 10 赫兹到 25 千赫的范围内。

在现实世界中,大多数音频硬件的设计上限是 20 到 30 千赫。人耳可以检测到高达 25 千赫的频率,感觉范围是 50 千赫。如果你在 45 千赫的频率上以 115 分贝的声压级播放声音,你会感到疼痛,但不知道为什么。有些人认为非常高的频率仍然以某种方式被感知,并增加了听众的享受。他们可能谈论的是谐波。如果你有一个 100 赫兹的声音,这个声音在 25 赫兹、50 赫兹、200 赫兹等频率上都有谐波。如果你剪掉了谐波,声音在高端听起来可能会有些死板。

我比较了我最喜欢的音乐在 CD 和黑胶唱片上的版本,区别就在于黑胶唱片上的额外噪音。我确实能感觉到交响乐中的差异——CD 上的安静段落没有划痕、嘶嘶声或嗡嗡声的干扰,而响亮的部分则响亮且准确,没有失真。如果你想自己进行比较,确保你拥有那些用技巧和细心录制的黑胶唱片和 CD。其中很多都是垃圾,而现代流行音乐的潮流就是将 CD 上的所有音量都调到最大,而不考虑动态范围、失真、细微差别或平衡。钢琴和风琴非常适合测试你的音频系统质量,因为它们的音色难以准确再现,它们有巨大的动态和频率范围,而且你可以很容易地判断它们是否听起来正确。尝试听一下约翰·塞巴斯蒂安·巴赫的《D 小调托卡塔与赋格》;这涵盖了管风琴的全部范围,那种你在教堂里看到的大管风琴。在某个时刻,低音踏板被长时间按下,你的扬声器可能会出现可见的失真。Pink Floyd 的《月之暗面》中的“Time”练习了左右和真正的中心之间的声音分离。如果你能找到原始的双黑胶唱片而不是一些糟糕的 CD 重制版,Jimi Hendrix 的《Electric Ladyland》是一份令人惊叹的录音室和艺术魔法作品,它将锻炼你的音频系统并回报你仔细聆听。

线路录音

原始的母带“磁带”是在线式录音机上制作的,它们使用钢线作为录音介质。线式录音机在 20 世纪 60 年代之前广泛使用,那时它们被磁带录音机所取代。像 20 世纪 20 年代卡特家族的原始录音这样的老音乐,就是在线式录音机上录制的。钢线会生锈,音质也并不令人兴奋,但它非常耐用。即便如此,大多数那些老录音都已经丢失了。

但不仅仅是这样!《现场热线:1949 年的伍迪·格思里表演》赢得了 2008 年的格莱美最佳历史专辑奖。它是从线式录音中恢复的,并被认为是他的唯一一次现场录音。像许多线式录音机一样,这些录音是在一个自制的设备上制作的,这使任何恢复过程都变得复杂。但它们确实被恢复了,现在你可以通过 CD 欣赏到伍迪·格思里的现场表演。

CD 在便利性上胜出。它们坚固耐用,不会因为播放而损坏,你不需要不断麻烦它们,而且它们是便携的。大多数 CD 播放器都有遥控器,你可以按任何顺序播放曲目或随机播放。你可以在 CD 换盘器中加载多个 CD 而不会损坏,并且可以享受数小时的乐趣。

尽管音乐产业试图阻挠我们的公平使用权利和享受音乐的方式,但制作定制混音 CD 和制作我们自己的混音磁带一样容易。而且出于大多数相同的原因:按照我们想要的方式包装音乐,以及发现新艺术家。(第五章讲述了如何制作混音 CD。)然而,我们现在有了两个非常新的选项,而在古时候我们没有这些选项,那就是卫星广播和互联网广播。它们在音质上都不算高,但在多样性和发现新艺术家方面是无与伦比的。商业广播电台比以往任何时候都要糟糕,这我之前不相信是可能的。

CD 在成本上也有优势。一百美元就能买到一个完全令人满意的 CD 播放器。即使在古时候,一个高质量的唱机、唱头和唱针也要花费几百美元,而且价格并没有降低。哦,别忘了防尘罩,它总是价格高昂的附加品。还有唱针跟踪力计、唱头校准工具、特殊清洁配件等等。

CD 播放器

你可以在 CD 播放器上花费很少或很多。理想情况下,你将在购买之前用你自己的音响系统测试它们,特别是如果你在寻找高端型号的话。与所有数字音频一样,数字到模拟转换器的质量决定了它听起来有多好,所以多花点钱可以有所区别。如果你将 CD 播放器连接到具有其自身 DAC(你将看到光或同轴数字输入)的接收器或放大器,这将为你提供两个 DAC 进行尝试。使用数字连接器意味着 CD 播放器将数字信号发送到你的接收器,并且不使用它自己的 DAC。相反,接收器执行转换到模拟。使用你的 CD 播放器的 RCA 连接器意味着你的 CD 播放器将执行转换并发送模拟信号到你的接收器。如果你有一个高端 CD 播放器,你可能不希望你的接收器干扰其输出,所以使用模拟 RCA 连接器。当然,事情并不总是那么简单,因为在一些现代的 A/V 接收器中,集成的预放器不考虑信号是模拟的还是数字的,这很愚蠢,但就是这样。这并不总是有文档记录,所以你可能不得不烦扰你的供应商以了解你有什么。

那么,谁赢了,黑胶唱片还是 CD?简单——你更喜欢哪一个。不要纠结于规格;重要的是音乐和你的享受。

寿命

寿命仍然是一个悬而未决的问题。当前数字存储的状态对长期来说并不令人鼓舞,所以你最好计划定期将你的存档转移到新的媒体上。长期数字存储有几个问题:一是物理媒体可能不会超过几年而不退化。二是想想过去 10 年或 20 年中已经出现并消失的封闭、专有文件格式,它们现在已无法读取。三是如果你的媒体幸存下来,文件仍然可读,你将有一个可以读取你的媒体的硬件设备吗?如果有人给你一个 5.25 英寸磁盘、一个 Zip 磁盘、一个 3.5 英寸磁盘或一个超级软盘,你会知道如何处理它吗?目前我们认为 CD、DVD、USB 闪存盘和 3.5 英寸硬盘是理所当然的,但它们都只是几年前的产品,我们不知道未来会怎样。

注意

在旧硬盘和软件中可能存在商业机会。阿尔文指出,“对于那些能够从古老媒体转换到当前媒体的人来说,有一个市场。我有一个用于 DC300 磁带的 Viper QIC 磁带驱动器,一个伯努利驱动器,一个 Questech 40MB 驱动器(它是苹果 Macintosh 的宠儿),一个 TEAC 数字音频磁带驱动器(205MB 存储),Zip 和 Jaz 驱动器,250MB 的科罗拉多 QIC,以及其他软盘驱动器。”

商业 CD 是通过压制而不是像家庭制作的 CD 那样烧录的,因此它们的寿命将比大多数家庭烧录的 CD 长,因为它们由更坚固的材料制成,并且有更深的沟槽。CD-R 的寿命将超过 CD-RW;不要将 CD-RW 用于你希望持续一年或两年以上的任何东西。

品牌之间有显著差异。太阳光学工业(Taiyo Yuden)是 CD 和 DVD 空白盘的顶级制造商。Taiyo Yuden 的空白盘以自己的品牌和不同的品牌名称出现,但二级供应商经常更换供应商,因此您不能仅凭名称来判断您将获得什么。真正的 Taiyo Yuden 空白盘仅在日本制造。存在伪造品,因此请在网上搜索如何识别真品的方法。

Verbatim、TDK 和索尼也被认为是好的品牌,尽管它们使用多个供应商。您可以使用 diskDVD Identifier 和 DVDInfo for Windows、DVD Media Inspector for Mac 以及 cdrecord 和 dvd+rw-mediainfo for Linux 在购买后读取光盘 ID。

第四章。为 CD 创建和编辑现场曲目

无标题图片

CD 非常适合存储和分发你自己的录音,你可以使用 Audacity 来准备你的曲目以便复制到 CD。

假设你在录音室或现场表演中录制了一些长曲目。你可能想将它们分成单独的歌曲,或者在歌曲之间剪掉材料并将它们缝合在一起,听起来像一条长而连续的现场录音。也许你正在剪切和粘贴几个不同录音会话中的最佳部分。也许你有需要将多声道录音下混为双声道立体声以用于 CD 的多声道录音。你想要清理一切,使其尽可能好。

实时录音具有挑战性。我将讨论几种不同的方法来完成这项工作,从经济且简单到更昂贵且对最终混音有完全控制。然后我们将继续使用 Audacity 来准备你的录音以便刻录成 CD。

注意

如果你需要回顾如何使用 Audacity,请查阅第一章。

工作流程是这样的:

  1. 录制东西。

  2. 在 Audacity 中应用清理和修复。

  3. 为单个歌曲创建歌曲标题和元数据。

  4. 导出为双声道 16/44.1 WAV。

  5. 复制到 CD 并享受!

最耗时的部分是修复和清理。如果你不需要做很多修复,那么这个过程会很快。

制作好的现场录音

在第二章中,我们学习了如何组装录音室以及如何将你的电脑变成数字音频工作站。制作好的现场录音比制作好的录音室录音更难,因为有很多事情是你无法控制的。然而,这没关系,因为你不一定追求某种技术上的完美,而是捕捉到兴奋和能量。

获取好的双声道立体声录音相当容易,因为几乎所有音频设备都支持双声道立体声。如果你想录制现场的多声道录音(以获得更多混音控制),那么你需要更昂贵的设备。

最大的潜在障碍之一是关于谁控制现场的声音系统。如果你控制,那么你可以做任何你想做的事情。如果表演者或场地有自己的系统和技术人员,那么你需要他们的合作。

记得录一些观众噪音,以防你需要添加更多现场风味。你还应该录制几分钟的各种背景和观众噪音,以便稍后用于噪声消除。你想要的是不与音乐混合的噪声样本,或者你想要保留的任何东西,以便进行最佳的噪声消除。

便携式数字录音机

The Zoom H2 on a microphone stand.

图 4-1。Zoom H2 放在麦克风支架上。

一款小巧的便携式数字录音机可能会让你惊讶于它捕捉现场表演的能力有多好。Zoom H2,这是我最喜欢的紧凑型数字录音机,内置了四个麦克风。你可以使用前对、后对或同时使用所有四个,以创建空间感的三维声音。Zoom 附带一个小支架,可以放在任何平坦的表面上,还有一个可以插入麦克风支架的把手,这样你可以轻松地将它放置在任何位置(图 4-1)。它不引人注目,甚至看起来像一台老式的麦克风。

Zoom 拥有一个 1/8 英寸立体声线路输入,这意味着你可以直接将其连接到调音台。通常在现场演出中,所有乐器和歌手都会连接到单个音响控制台,即使是预算最低的控制台也应该有一对立体声 RCA 录音输出。Zoom 使用一个双 RCA 到 1/8 英寸立体声 TRS 适配器,如图图 4-2 所示。

Zoom H2 配备双 RCA 到 1/8 英寸立体声适配器,用于连接到调音台

图 4-2. Zoom H2 配备双 RCA 到 1/8 英寸立体声适配器,用于连接到调音台

无论你通过连接到音响板监控端口的耳机听到什么,你的录音就会是这个样子,因此理想情况下,应该有一个人在音响板上保持所有通道平衡且声音良好。因为所有内容都已经混合成两个通道,你的编辑选项有限,所以需要在录音时确保正确。

Zoom 还配备了一个 USB 1.1 端口,可以连接到你的电脑,因此如果你更喜欢的话,可以直接将录音保存到电脑上,而不是保存到 Zoom 的 SD 存储卡中。

你不必因为喜欢 Zoom H2 就一定要使用它——有数十种不同的优秀便携式数字录音机可供选择,具有各种功能集。

配有 Audacity 的笔记本电脑

配置一台装有 Audacity 和不错的录音界面的笔记本电脑,将其插入现场演出的音响控制台,你就可以现场编辑和制作 CD。将原始轨道复制到 USB 闪存驱动器,供希望自行编辑的表演者使用。如果你的笔记本电脑内置声卡不适合你,尝试使用一个像图 4-3 中所示的那样好的外部 USB 录音界面,它展示了一台准备好的 ThinkPad 和 M-Audio MobilePre USB,可以用于现场演出。

另一个选择是使用高端的 PCMCIA 声卡,如 Digigram VXpocket v2。Digigram 的价格大约为 500 美元。它适用于 Linux、Windows 和 Mac;提供全双工的双通道;并支持 S/PDIF 和 XLR 连接器。

ThinkPad 和 M-Audio MobilePre

图 4-3. ThinkPad 和 M-Audio MobilePre

多轨现场表演录音

假设你想要更多的编辑和混音控制,并且你想要制作多通道现场录音。你该如何做?这需要正确的知识和足够的预算来支持所有必要的设备。Audacity 从版本 1.3.9 开始可以一次记录与你的录音接口支持的那么多轨道。较老的 Audacity 版本最多支持 16 个轨道。(参见第九章了解如何使用 Audacity 制作优质的多轨录音。)

如果你真的不知道自己在做什么,不要尝试这样做,因为错误地连接设备会导致声音质量差,甚至损坏设备。如果你没有控制现场音响系统的权限,那么你需要现场音响工程师的合作和帮助。这里有四种不同的方法来制作现场多轨录音。

一个选择是自备麦克风,并从现场音响系统独立地分别对每位表演者和乐器进行录音。虽然这意味着到处都是很多麦克风和电缆,但这让你能够独立于主音响板使用自己的录音设备。

更常见的一个选择是使用麦克风和乐器电缆分路器,让每个麦克风和乐器电缆都能双重使用。这就是许多专业人士录制现场音乐会的方式;他们通过分路器共享麦克风,每个团队控制自己的录音控制台。有时这些控制台被藏在后台,有时它们有长长的电缆线延伸到移动录音车。这种设置具有很大的灵活性,你可以根据自己的需要添加自己的麦克风。例如,似乎有一个规则,即没有人能就麦克风鼓的正确方式达成一致,所以他们都会设置自己的鼓麦克风。

你需要分路器、变压器,可能还需要一些电阻和接插件面板,以及电缆,并且你需要知道如何连接所有这些设备。你需要了解处理幻象电源的来龙去脉以及谁提供它,正确顺序地连接和断开,与其他舞台和音响团队相处融洽,以及更多。

另一个选择是直接连接到一个支持多通道输出的调音台。(一个需要了解的词是busses——调音台拥有的 busses 越多,其信号路由选项就越灵活。)这样你就不需要多余的麦克风或分路器以及长长的电缆线。寻找直接输出辅助发送子组输出。一些输出发送的信号会受到调音台控制的影响,因此它们会有淡入淡出和特殊效果,这些由控制台技术人员应用。如果你想要一个未经处理的直接信号,这取决于音响控制台的功能以及音响技术人员能让你使用什么。

如果您是音响工程师并且可以使用自己的设备,考虑购买一个多通道数字混音器,如 PreSonus StudioLive 16-Channel FireWire 数字混音器。这样您就不需要单独的 ADC/DAC,也不必费解如何让为现场表演设计的模拟控制台也做出好的数字录音。遗憾的是,StudioLive 在 Linux 上不受支持,但它为 Mac 和 Windows 提供了优秀的软件包。这是一款非常棒的新一代混音器,旨在支持多通道录音,无论是在录音室还是在表演厅。它的价格大约是 2,000 美元,此外您还需要一个放大器来为现场表演供电。

对音响团队友好

对场馆的音响工程师和团队友好。他们是技艺高超的专业人士,必须结合科学和艺术,他们会让您的录音成功或失败。不要表现得好像您什么都知道,因为他们不会被愚弄。根据我的经验,现场表演的音响团队都是好人,只要您仔细倾听,乐于助人,不挡他们的道,他们会慷慨地分享他们的专业知识。

Audacity 录音设置

让我们浏览一下“编辑”>“首选项”中的适当录音设置。(请访问第十三章和第十四章,了解如何调整您的 PC 以进行音频录制和管理您的声音设备。)

首先,打开一个新的 Audacity 项目,使用“文件”>“另存为”保存并命名您的新项目。当 Audacity 正在录音时,您无法保存更改,因此您可能可以利用短暂的休息时间停止录音,按 Ctrl-S 或使用“文件”>“保存项目”,然后使用 shift-Record 从您离开的地方继续。

在“编辑”>“首选项”>“设备”选项卡上设置您的录音和回放设备,并设置您要录制的声道数。Audacity 将仅显示您的录音接口支持的声道数。Windows 用户,始终选择“Windows DirectSound”而不是 MME 作为主机,因为 MME 是过时的通用 Windows 声音接口。如果您只有一张声卡,可以选择“主声卡”作为您的录音和回放设备。如果您有多张,则从下拉的“录音设备”菜单中选择特定的录音接口(图 4-4

图 4-4. 在 Windows 的“编辑”>“首选项”>“设备”对话框中设置正确的录音和回放设备

图 4-5 显示了它在 Linux PC 上的样子:

在 Linux 的“编辑”>“首选项”>“设备”对话框中设置正确的录音和播放设备

图 4-5。在 Linux 的“编辑”>“首选项”>“设备”对话框中设置正确的录音和播放设备

你可能想在演出中的休息时间检查你的录音,所以将你的播放设备设置为输出到耳机的设备。

在“录音”选项卡上,取消选中“叠加”,“软件播放”和“声音激活录音”。除非你遇到断开连接,否则不要更改你的延迟设置。断开连接意味着你的 CPU 跟不上,所以增加音频到缓冲区值,直到断开连接停止(图 4-6)。

“质量”选项卡上的设置(图 4-7)取决于你的模拟-数字转换器支持什么。假设你有一个连接到高端声卡的模拟混音器,该声卡支持高达 24/96(24 位深度,96 kHz 采样率);如果你有足够的硬盘空间,你可以以 32 位深度和 96,000 Hz 采样率进行录音以达到最高质量。(位深度在这个菜单中称为样本格式。位深度是正确的术语。)

在“录音”选项卡中设置设置

图 4-6。在“录音”选项卡中设置设置

质量选项卡上的设置由你的录音接口支持的以及你的偏好决定。

图 4-7。质量选项卡上的设置由你的录音接口支持的以及你的偏好决定。

我的 MobilePre 最大支持 16/48,所以我将 Audacity 设置为 32 位浮点/48 进行录音。设置比你的录音接口支持的采样率更高的采样率(上采样)是没有用的,因为没有魔法般的质量提升。这会浪费磁盘空间,并拖慢你的 CPU,而且上采样会损害音频质量。但在 16 位声卡上录制 32 位浮点也有好处,这在第一章中有解释。(在 16/44.1, 24/96, 32 位浮点中了解更多关于质量设置的信息。)

如果你从数字混音器或具有自身数字输出的混音器录制,那么这将决定你的最大比特深度/采样率。例如,Behringer Xenyx X2442USB 24 通道混音器是一款具有内置 ADC 的模拟混音器,通过 USB 提供 16/48 数字信号。它可以直接插入你的电脑,因此你不需要声卡。所以你可以将 Audacity 设置为以 32 位浮点/48kHz 的格式进行录制以获得最大质量。如果 16/48kHz 不够好,你可以连接一个支持更高比特深度和采样率的外置 ADC 到 Xenyx 的 RCA 模拟录制输出。

在完成之前不要切换你的质量设置!

在整个录制和编辑过程中,最好保持相同的质量设置,直到最终导出。改变比特深度和重新采样对音频质量不利,因此,录音重新采样或导出为较低比特深度的次数越少,越好。我以 32 位浮点/48kHz 的格式进行录制和编辑,然后根据需要导出不同质量级别的文件,例如,为了最高质量,导出 24 位 WAV 和 FLAC 格式,或者导出较低质量的 Ogg Theora 或 MP3 格式。如果你更喜欢在较低质量级别进行录制和编辑,例如 16/44.1(这是 CD 质量),同样适用:从录制到最终编辑都使用 16/44.1,然后如果你需要更低的质量级别,在导出时根据需要选择。

44.1kHz 采样率和 48kHz 之间没有太大的区别。采样率决定了你的频率范围,大约是采样率的一半。44.1kHz 覆盖了人类听觉的范围。有时我可以在 48kHz 录制的录音和 44.1kHz 录制的录音之间听到细微的差异,但必须在一个好的音响系统上仔细聆听。16 位和 24 位录音之间的差异更为明显。从高质量的录音开始,然后你可以根据需要导出任意数量的较低质量格式。

设置录音音量级别

在开始之前,通过点击输入音量表(图 4-8

图 4-8. 在开始录音之前,打开录音监控器以设置峰值录音电平。

开始、停止和暂停录音

当你准备好开始录音时,只需点击红色的录音按钮。点击暂停以停止,然后点击录音以在同一轨道上继续。点击停止然后录音会开始新的轨道,所以如果你在打算暂停时停止了,可以通过按 shift-Record 在同一个轨道上重新开始。

监听现场录音

监听录音的最佳方式是通过将耳机插入监听端口。例如,MobilePre 有一个零延迟监听端口,混音器上通常都有监听端口。更好的录音接口都有零延迟监听端口,这是你在购物时应该寻找的好东西。

编辑现场录音

嗯,那很有趣!你听到了一场精彩的演出,或者有一个美妙的录音室会议,并且一切录音都成功了。现在你如何将所有这些美好的东西放到 CD 上?

如果你使用的是数字录音机,你需要将文件从录音机复制到你的 Audacity 电脑上。我更喜欢使用单独的存储卡读卡器,而不是将录音机连接到电脑,因为这通常工作得更好,速度更快,尤其是在非 Windows PC 上。任何 SD 或 Compact Flash 卡都应该被你的 PC 视为通用的 USB 存储设备,但制造商喜欢用奇怪的仅限 Windows 的文件传输管理器来侵扰使用它们的设备。这对我来说没有意义,因为 Windows 有一个非常好的内置 USB 存储设备管理器。其中许多还喜欢使用 USB 1.1,而不是全速 12Mbps,而是令人痛苦的慢速 1.5Mbps 版本,当你填满一个多吉字节 SD 卡时,这会非常有趣。

无论你如何操作,一旦你的录音转移到 Audacity PC 上,打开 Audacity 并使用文件 > 打开将你的录音导入 Audacity。然后使用文件 > 另存项目为保存这个新的 Audacity 项目,并给它一个不同于音频文件名的名字。Audacity 会警告你“项目依赖于其他音频文件”(图 4-9),并询问你是否想将所有音频复制到项目中。点击将所有音频复制到项目中(更安全)。现在你有了原始录音和副本,你在 Audacity 项目中进行的任何操作都不会触及原始文件。(参见保存你的工作以了解更多信息。)

制作原始录音的副本以保存它

图 4-9. 制作原始录音的副本以保存它

如果你的录音有多个文件,为每个文件创建一个单独的 Audacity 项目。我喜欢使用相关的项目名称,比如 Fiddle-Festival-1、Fiddle-Festival-2 等等。

如果你最初在 Audacity 中进行了录音,你可以从原始项目文件开始工作,这将改变它,或者你可以复制一份并从那份副本开始工作。要复制,请点击文件 > 另存为以不同的名称保存。

编辑和下混音多轨录音

如果你正在使用双声道立体声录音工作,可以跳过这一节。

本节是对多声道下混音的简要回顾,因此请访问第九章以详细了解多轨录音和混音。

如果你制作了多轨录音,即三个或更多音轨,你将比使用双声道立体声混音有更多的优秀编辑选项。每个音轨对应一个歌手或乐器,这为你提供了终极控制,即使由于混音器的限制你不得不满足于子组,这仍然是一个灵活性的盛宴。

从 Audacity 版本 1.3.8 开始,你可以通过选择视图 > 混音板来使用时尚的新混音板调整每个音轨的平衡和增益。在 Audacity 中的播放效果与你的混音听起来完全一样,因此你可以获得准确的预览。

当然,如果你愿意,你仍然可以使用每个音轨的音轨面板上的平衡和增益控件。

不论你是否有立体声混音还是多轨录音,编辑和修复你的音轨都是一样的,我们将在以下章节中介绍。多轨录音有一些特殊的风险。一个是保持它们同步。在删除和添加时要小心,因为这会改变音轨的长度。另一个是将下混音到双声道立体声,这会将音轨合并,使它们变得更响,可能会产生削波。第三个是“链接音轨”按钮,它首次出现在 Audacity 1.3.9 版本中。这会将标签音轨与音频音轨同步。在项目顶部有一个标签音轨对于做笔记很有用,并且它不会链接到其下方的音轨。但是,位于你的音频音轨之下的标签音轨,即当你创建新的标签音轨时新标签音轨总是出现的地方,创建了一个包括其上方所有音频音轨的音轨组。默认情况下启用“链接音轨”,所以如果它妨碍了你,只需点击链接音轨按钮即可关闭它。较新的 Audacity 版本会在你进行任何选择或时间移动音轨时显示链链接,这表明“链接音轨”是激活的(图 4-10)。

当链接音轨按钮激活时出现链链接。

图 4-10。当链接音轨按钮激活时出现链链接。

下混有两种方法。第一种方法是点击轨道 > 混音和渲染,这在 Audacity 项目中创建一个新的立体声轨道。然后你可以在导出之前进行进一步的调整,例如创建标签、修复和其他编辑。它听起来就像 Audacity 中的播放一样,所以当它在 Audacity 中听起来正确时,它就准备好了。首先在轨道菜单中设置你的左、右和单声道通道分配。左是通道 1,右是通道 2,单声道轨道混合到两个声道中。

当你点击轨道 > 混音和渲染时,你的轨道将被一个新的立体声轨道替换。如果你希望 Audacity 创建一个不替换原始轨道的新立体声轨道,请使用键盘组合 ctrl-shift-M。我更喜欢第二种方法,因为我想要保存我的原始轨道。然后我将新的立体声轨道复制到一个新项目中,完成编辑,然后导出。

下混会合并轨道,因此它们会变得更响。确保视图 > 削波被激活,这样你可以快速找到削波段落。你可以在下混之前使用效果 > 放大将所有轨道的振幅减少到-9 或-12,然后在下混后应用效果 > 归一化将音量恢复到你想要的位置。

第二种下混方法在导出时打开一个自定义混音器,这实际上是一个通道映射器。打开编辑 > 首选项 > 导入/导出,然后选择“使用自定义混音”。然后选择文件 > 导出,你将得到一个简单的混音器(图 4-11

图 4-11. 将多声道录音下混为两个立体声轨道

这与文件 > 导出多个不兼容,所以如果你想将下混的轨道分割成单独的歌曲,你将不得不将其重新导入到 Audacity 中。

Audacity 中的特殊 CD 设置

接下来你需要做的是转到选择工具栏,并将时间更改为 CD 帧,每秒 75 帧(fps)。这确保你做的任何剪辑都将开始和结束在一个 CD 帧上。任何落在这些帧之外的音频将会丢失,并可能产生点击声。图 4-12显示了这看起来是什么样子。你可以选择 hh:mm:ss + CDDA 帧(75 fps)或 CDDA 帧(75 fps)。前者显示时间加上 CD 帧,后者仅显示 CD 帧。勾选“吸附到”框以确保停止和开始总是在 CD 帧边界上。

在选择工具栏中设置 CD 音频的正确帧率

图 4-12。在选择工具栏中设置 CD 音频的正确帧率

当你在选择工具栏上时,将项目速率设置为 44,100 Hz。CD 音频文件必须是 16/44.1 WAV 文件。(位深度将在导出时选择。)

剪辑

现在是时候对你的录音进行一些清理了。记住你有许多不同的视图可供选择,例如视图>窗口适应视图>垂直适应,以及缩放工具。按 ctrl-2 返回正常视图。视图>缩放到选择是一个节省时间的妙招,它将你的选择扩展到窗口的宽度。记住,Audacity 几乎有无限的撤销功能,甚至超过保存。直到你关闭项目,你不会丢失撤销历史。

一个好的起点是修剪掉任何多余的部分。当你选择要删除的不想要的片段时,留下一点多余的部分。你总是可以修剪更多,但放回原处会更难。图 4-13 中阴影区域是一群人在演讲,这不是我想保存的内容,所以它一次性被删除了。目前似乎没有在歌曲开始或中间需要修剪的内容,所以我将留到以后再处理。

另一种大量修剪多余内容的方法是选择要保留的部分,然后点击修剪按钮。这会保留你的选择并删除其余部分。

分离立体声轨道以进行手术修复

有时,双声道立体声轨道中只有一个声道会出现缺陷。如果你将其分成两个轨道,那么你就可以只修复这个声道,然后重新连接轨道。这样做有几个优点:第二个轨道有助于掩盖不太完美的修复,而你应用于故障部分的修复可能不会改善另一个声道的声音,甚至可能损害音质。

使用视图>窗口适应来对整个轨道进行粗略剪辑

图 4-13。使用视图>窗口适应来对整个轨道进行粗略剪辑

要分割立体声轨道,转到轨道菜单并点击分割立体声轨道。要重新连接轨道,使用顶部轨道的轨道菜单并点击制作立体声轨道。两个轨道必须相邻。

修复削波和过响的段落

查找任何削波和过响的段落并修复它们。这些会破坏整个轨道的音量水平并震惊听众,因此修复它们总是一个好主意。

通过选择查看 > 显示削波快速找到任何削波。这会用红色条标记任何削波段落。放大削波部分,直到你可以精确选择声音过大的部分,然后使用效果 > 放大中的负值,例如-3 dB,来降低音量。重新录制削波部分更好,但鉴于你可能不会在现场表演中有这样的机会,使它们不那么明显是次优选择。点击预览按钮查看是否听起来合适,如果不合适,更改放大值直到它合适。然后点击确定使其成为永久更改。

注意

编辑 > 首选项 > 播放中调整预览长度。默认为三秒。

寻找任何未削波的极端峰值,这可能是一个鼓点、突然的观众噪声、掉落的东西、麦克风碰撞——无论是什么,检查一下并决定是否需要降低音量。

如果有任何削波或过于响亮的段落让你想要完全删除,选中它并选择编辑 > 静音(或 ctrl-L)使其完全静音。你可能不想删除它,因为这会缩短音轨,在多轨项目中可能会造成问题。如果它太长,静音会太明显,尝试用其他地方的剪辑修补令人讨厌的部分。为此,首先使用编辑 > 分割剪切删除有问题的部分。这会在删除部分的位置留下一个空隙。然后,将从音轨的另一部分或甚至从不同的音轨中复制的相同长度的片段仔细粘贴到空隙中;只要听起来合适,你可以使用任何东西。这可能是一项棘手的工作,所以记得放大以便可以看到你在做什么。包络工具适用于平滑过渡和谨慎的淡入淡出,或者尝试绘图工具来应用一些谨慎的插值。

噪声消除

Audacity 的噪声消除工具相当不错,尽管可能需要尝试几次才能正确使用,因为噪声消除总是与其副作用——消除噪声也会影响到你想要保留的声音——的一种妥协。如果你想要保留的声音与噪声具有相似的音量和频率,你可能不会得到很好的结果。当噪声与你想要保留的内容明显不同时,噪声消除效果最佳。

首先,您需要创建不想要的噪声的配置文件。这就是为什么您在现场表演中录制了各种观众和背景噪声样本,这样您就有好的样本来创建配置文件。通过选择 5 到 30 秒的噪声片段来创建噪声配置文件,然后转到效果 > 噪声消除并点击获取噪声配置文件。(如果您的样本不够长,可以通过复制和粘贴到同一轨道上将其加倍。)然后选择您想要从轨道中移除噪声的部分,返回效果 > 噪声消除,并点击预览按钮来听其声音(图 4-14)。

噪声消除效果有三个可调节的设置:噪声减少、频率平滑和攻击/衰减时间。噪声减少控制噪声音量的减少程度,因此-10 的值将其降低 10 分贝,而-50 的值将使其变为静音。对于频率平滑和攻击/衰减时间,将滑块向左移动更为激进,而向右移动则进行更温和的改变。频率平滑的值越大,其改变频率的范围就越广。记住:攻击指的是音符敲击的力度,衰减是指音符消失所需的时间。较小的值更为突然,而较大的值则更为渐进。

当预览听起来不错时,点击确定。如果您按下确定后不喜欢它,请按 ctrl-Z 撤销,或使用编辑 > 撤销,再次尝试。

使用噪声消除效果降低不想要的背景噪声

图 4-14. 使用噪声消除效果降低不想要的背景噪声

您可以使用来自 Freesound Project(www.freesound.org/)的噪声样本来构建您的噪声配置文件。这是一个 Creative Commons 许可的协作数据库,包含各种声音。在这里,您可以找到几乎所有东西,包括白色、粉色和棕色噪声的样本;不良 TRS 插头连接的嗡嗡声;台球厅噪声;等等。您也可以向该项目贡献自己的样本。

压缩动态范围

在音频编辑中,明智地使用动态范围压缩是一项重要的技能。例如,在有多个人说话的播客中,确保说话者的音量水平都相同是对听众的一种善意。压缩也用于改变声音的特性。例如,鼓主要是快速峰值声音,因此使用一点压缩可以使其听起来更饱满、更丰富。压缩可以使歌手或乐器“突出”于混音中,使其听起来更生动。压缩还可以帮助平衡表现不稳定的表演者,如麦克风技术不佳的歌手或音量控制不佳但音量时大时小的乐器演奏者。

你可以用压缩实现的效果将受到你的录音的限制。如果你有每名表演者和乐器都在自己音轨上的多轨录音,或者是有用的小组划分,那么你将拥有各种编辑灵活性。如果你的录音是双轨立体声,那么你无法进行非常精细的编辑,但你可以对整个录音应用压缩,使其在嘈杂的环境中听起来更好,例如在车辆和工作场所。自己控制它意味着你可以测量出恰到好处的量。

在音频链中,有几个地方可以应用压缩。在录音过程中使用了压缩器吗?如果是的话,请注意不要应用更多,因为这可能会使你的音轨听起来不自然或奇怪。

在使用压缩方面,我比较保守。如果某物需要更响亮或更安静,我更喜欢使用包络工具或放大效果进行调整。在磁带录音的古老日子里,像杜比降噪这样的压缩技术被用来最小化磁带嘶嘶声。音乐在录音时被压缩,然后在播放时扩展以降低噪声阈值。数字音频的信号与噪声比非常高,这并不必要。

现在让我们学习如何使用 Audacity 的压缩效果(图 4-15)。

Audacity 的压缩效果应用于动态范围压缩

图 4-15. Audacity 的压缩效果应用于动态范围压缩

选择你想要应用压缩的部分,是音轨的一部分还是整个音轨,然后点击效果 > 压缩以打开压缩效果。你可以通过拖动角落使压缩器窗口更大并扩展分贝刻度。

阈值设置确定音频信号增益降低的起始点,以分贝为单位。-60 dB 的阈值意味着所有幅度为-60 dB 及以上的内容都将降低增益,这在大多数情况下是过多的,因为那将是一切。-10 dB 的阈值意味着你音轨中最响亮的部分 10 dB 的增益将被降低。

噪声阈值设置通过在信号回到阈值水平之前保持增益恒定,防止在暂停期间放大背景噪声;它不允许在低于噪声阈值分贝设置的安静段落中增加增益。如果你的音频中没有安静暂停,那么这个设置帮助不大,你应该将滑块完全移动到左侧,-80 dB,以使其没有效果。

比率设置控制了对高于你的阈值设置的音量应用多少压缩或增益降低。较高的比率,如 4:1,意味着更多的压缩。一个比阈值高 4 dB 的输入信号将被降低到比阈值高 1 dB,因此它应用了 3 dB 的降低。首先尝试更温和的比率,从 2:1 开始,然后听预览。如果不够,尝试更高的比率。Audacity 的压缩器的最大比率为 10:1,这是一个很大的比率。其他压缩器的比率可以高达 60:1。

攻击时间决定了压缩应用的快慢,而衰减时间决定了压缩逐渐消失所需的时间。攻击时间过短可能会导致一些可听见的失真,而衰减时间过长可能会错过一些短峰值。预览按钮可以帮助你快速尝试不同的设置。

压缩会使你的音频变得更安静,因此你可能需要在应用压缩后放大或归一化它。压缩效果有一个“压缩后为 0 dB 增加增益”的复选框,这另一种说法是应用归一化到 0 dB。我不使用它,因为我更喜欢单独控制归一化,而且我并不总是将归一化到 0 dB,但如果你需要,它在那里。

也有一个“基于峰值压缩”的复选框。当此框未被勾选时,这是默认设置,压缩器会使用均方根值来降低高于阈值水平的音量的增益。“基于峰值压缩”则提高高于阈值水平的较安静音量的增益。

在使用压缩时要小心,因为它很容易过度使用。在许多现代流行音乐中,几乎没有任何动态范围;所有内容都被压缩到相同的狭窄 5 dB 或更小的范围内,没有任何安静的部分,没有对比,只有一个大的喊叫块,所有内容都被提升到最大,有时甚至达到失真。任何情感冲击和艺术性都被破坏。你试图使它在不同的听音环境中更加舒适,或者改善歌手或乐器的声音,而不是完全杀死录音。

访问压缩动态范围以了解更多关于动态范围压缩以及如何使用出色的克里斯动态压缩器,请参阅改变速度。

将单个长音轨切割成单独的歌曲音轨

当你在 Audacity 项目中有一个单个立体声音轨并且已经完成了所有的其他清理和修复工作时,请执行此操作。Audacity 项目中的一个单个立体声音轨可以包含多个歌曲,但对 Audacity 来说,它是一个长而连续的音轨;它不知道歌曲的分割点在哪里,所以你必须自己标记。你可以采取两种不同的方法。一种是通常的带有几秒静音分隔的单独歌曲集合。另一种是标记歌曲分割点,这样你可以随意跳过,但它们之间没有分割,就像现场音乐会专辑一样。

无论你更喜欢哪种方式,只需按照图 4-16 中的说明操作:确定每个歌曲的分割点;然后按 ctrl-B 标记位置并创建一个标签。这是你输入歌曲名称的地方。标签位于歌曲的开头,所以当你开始时,首先按键盘上的Home键确保你处于最开头。

使用标签轨道创建歌曲标题并将长轨道拆分为单独的歌曲

图 4-16. 使用标签轨道创建歌曲标题并将长轨道拆分为单独的歌曲

如果你需要移动一个标签,通过其移动手柄(即小圆点)抓住它(图 4-17).

角度手柄用于扩展标签以标记你的轨道部分。这些被称为区域标签(图 4-18). 在创建和管理标签中了解有关标签和标签轨道的所有信息。

标签手柄中的小圆点用于移动标签。

图 4-17. 标签手柄中的小圆点用于移动标签。

拖动角度手柄使用标签标记轨道部分

图 4-18. 拖动角度手柄使用标签标记轨道部分。

在 Audacity 版本 1.3.9 及更高版本中,请注意链接轨道按钮。这会保持音频和标签轨道同步,并在你不想对齐轨道时造成干扰。如果链接轨道妨碍了你,请将其关闭,尽管这对单个立体声轨道来说不太可能成为问题。链接轨道可能不会出现在第一个 2.x Audacity 版本中,但可能在解决了一些问题后出现。在链接轨道和轨道组中了解更多关于链接轨道的信息。

在歌曲之间创建优雅的分割

使用包络工具创建淡入和淡出

图 4-19. 使用包络工具创建淡入和淡出

在 Audacity 中创建歌曲之间的静音,并带有优雅的渐入和渐出,非常简单。这里有几个工具可供选择。首先,让我们尝试使用包络工具。图 4-19 展示了它的实际应用,创建了一个大约 2.5 秒的渐弱到静音,然后又渐入。那些小,白色的方块是节点控制点。通过点击音轨创建这些节点,然后你可以移动它们进行调整。每个节点有四个控制点——一对内控制点和一对外控制点。控制点可以在水平和垂直方向上移动。要删除一个节点,抓住一个控制点并将其拖出音轨的边界。

包络工具在大多数音频编辑应用中都是标准的。掌握它们需要一点练习,但一旦你弄懂了,你就能对渐变和振幅获得高度的控制。

你也可以尝试选择效果 > 渐弱效果 > 渐强,这既快又简单。你所能控制的就是渐变的长度。首先选择你想要渐变的片段,然后应用效果。图 4-20 展示了如何创建一个 10 秒的渐弱效果。

首先选择 10 秒的片段,然后应用效果 > 渐弱。

图 4-20. 首先选择 10 秒的片段,然后应用效果 > 渐弱。

假设你希望在歌曲之间有两秒的静音,但它们之间没有那么多空间——没问题,你可以通过选择生成 > 静音来插入你想要的任何静音。使用选择工具标记你想要静音开始的位置,选择生成 > 静音,将其设置为两秒,然后点击确定

注意

警惕那些在歌曲之间自动插入两秒间隔的 CD 刻录应用。这应该是一个可配置的行为。

归一化

执行的最后一步之一是将归一化应用于提升你的音轨音量。选择整个音轨,然后选择效果 > 归一化。检查“移除任何 CD 偏移”和“归一化最大振幅到”两个选项。最大振幅的最高值是零,这对于双声道立体声音轨来说是一个很好的值。

可选音轨元数据

你可以选择使用文件 > 打开元数据编辑器对话框来写入音轨元数据。在导出之前,填写所有音轨的共同信息:艺术家名称、专辑标题、流派、日期和注释。Audacity 将自动从标签或音轨名称中填写音轨名称,并自动为每个音轨编号。如果你在导出之前打开编辑 > 首选项 > 导入/导出对话框并勾选“在导出步骤之前显示元数据编辑器”,你可以为每个音轨查看预览。取消勾选此选项以跳过每个音轨的预览。

WAV 格式不支持 CD 文本或元数据。(其他音频文件格式支持,例如 Ogg、FLAC 和 MP3。)这不同于 CD 文本。CD 文本是对 Red Book CD 音频格式的非标准扩展,可以在支持它的 CD 播放器上显示歌曲标题。大多数软件 CD 播放器支持 CD 文本,新的家用和车载 CD 播放器也是如此。大多数 CD 刻录软件支持 CD 文本,因此当你在制作 CD 时可以输入单个歌曲标题。一些 CD 刻录程序(如同时运行在 Linux 和 Windows 上的 Nero)会从文件名中提取歌曲标题,这是一个节省时间的妙招。

元数据始终保存在你的 Audacity 项目中。

最终导出

这是一次伟大的旅程,从录音到编辑,现在你只需再走两步就能制作出你出色录音的 CD。倒数第二步是将你的录音导出为 CD 的正确格式,即 16/44.1 双声道 WAV 格式。这也是将你的音轨分割成单个歌曲文件的一步。(如果你的项目有超过两个音轨,请参阅编辑和混音多轨录音,在编辑和混音多轨录音中。)

如果你还没有将项目的采样率设置为 44.1,请现在设置。在选择工具栏上将项目速率设置更改为 44,100 Hz。然后选择音轨 > 重采样,设置速率为 44,100,并点击确定。对于较长的音轨,这可能需要几分钟。

现在点击文件 > 导出多个。输入你想要保存音频文件的目录,并选择“根据:标签”拆分文件和“使用:音轨/标签名称”命名文件。

点击选项按钮设置正确的导出格式。选择标题:WAV(微软)和编码:有符号 16 位 PCM(图 4-21)。

CD 的正确导出格式设置

图 4-21. CD 的正确导出格式设置

你的音轨将以单个 WAV 文件的形式导出,每个标签一个。

将你的歌曲刻录到 CD 上

现在你有一批漂亮的单独 WAV 文件,每个文件对应一首歌曲。使用你喜欢的 CD 刻录程序将你的曲目刻录到 CD 上。务必创建一个音频项目而不是数据项目,因为 CD 必须以 Red Book 音频格式才能在所有 CD 播放器中播放。将刻录速度设置为最大速度的一半,作为防滑垫的保险。一些 CD 刻录程序,如 Nero,会自动从你的 WAV 文件名中获取歌曲标题,这是一个节省时间的功能。大多数 CD 刻录程序会在歌曲之间创建默认的两秒间隔,所以要注意这一点。你可以通过消除这些间隔来制作听起来像一条长而连续的轨道的现场专辑,同时仍然有单独的歌曲轨道,这样你可以随意跳过。

标记你的光盘

不要在光盘上使用粘性纸标签,因为这些标签会随着时间的推移而损坏光盘。有更好的方法来制作看起来很漂亮的标签。你可以购买特殊的空白光盘,这些光盘是为了使用支持打印在光盘上的喷墨打印机而制作的。这些打印机与普通打印机不同,因为它们有一个特殊的托盘来固定光盘。

另一种可打印光盘需要特殊的热敏打印机。这些打印机并不昂贵,通常价格在 100 美元左右。

第三种是LightScribe光盘,它需要一个特殊的 CD 刻录机和空白光盘。这些成本与普通 CD/DVD 刻录机大致相同,大约 50 美元。

有许多软件程序可以设计你的光盘标签,并使它们看起来既美观又专业。

大量光盘复制

你可能想要制作光盘进行分发,而且你可以不花大量金钱就做到这一点。有许多激光光盘复制器,就像你的计算机 CD 刻录机一样,只是更快,并且有多个托盘。这些复制器的价格从约 400 美元的简单复制器(手动喂入)到数千美元的自动喂入和本地数据存储不等。

此外,还有提供不同级别服务的商业复制服务,例如封面艺术和设计。这些服务既经济又省时省力。最好的光盘是压制而不是刻录。使用压制机而不是激光复制机的复制服务成本更高,通常需要更大的批量。但你的光盘将更耐用。

“我需要购买特殊的音频 CD 吗?”这是一个常见的问题。不,你不需要。所有光盘都是完全相同的类型,但坚持使用像 Taiyo Yuden(我最喜欢的品牌)这样的好品牌是值得的。Verbatim、Ridata 和 MAM-A 也是可靠的品牌。始终购买 CD-R;除非是实验,否则不要麻烦使用 CD-RW。有关更多信息,请参阅没有特殊的音频 CD,见音频 CD。

从不同录音会话中组合歌曲、修复和特殊效果

有几种不同的方法可以将不同录音会话中的歌曲组合到 CD 上。请参阅第五章了解如何做到这一点。

第十一章 讲述了特殊效果,而 第十二章 则提供了更多关于修复和清理的细节。

第五章。制作混音 CD

无标题图片

你可以制作定制的混音 CD,就像我们过去在旧时代制作定制的混音磁带一样。制作你自己的定制混音光盘有许多原因:制作你自己的歌曲收藏,制作你自己的最佳曲目试听集,组合你最好的现场表演,制作派对光盘,制作你自己的音乐促销 CD,剔除你不需要的歌曲,将几个 CD 或 LP 压缩成更少的磁盘……无论你的原因是什么,使用 Audacity 都很容易做到。

这个新奇的数字时代是最好的:你可以制作完美的原始副本,而且使用电脑编辑文件比在磁带上更快、更容易。创建你自己的定制 CD 是这样的:在 Audacity 中收集你想要使用的音频轨道,进行清理和编辑,编写你的轨道元数据,导出为你的所需格式,刻录到 CD,然后你就完成了。

音频 CD

你可以制作两种类型的音频 CD,你选择哪种类型取决于你的播放设备。在所有 CD 播放器上播放的标准 CD 是根据红皮书 CD 音频标准编码的。这就是商业录音 CD 所使用的,这也是你想要用来制作通用播放光盘的。这并不是什么大技术问题,因为你所需要做的只是在你的 CD 刻录程序中选择“创建音频 CD”。你必须始终为红皮书 CD 创建 16/44.1 WAV 文件。

你可以制作的第二种 CD 是根据橙皮书标准编写的,用于在电脑上播放。同样,这也不是什么大技术问题;它只是一个普通的数据 CD,在你的 CD 刻录程序中,你将选择“创建数据 CD”。在这种类型的磁盘上,你可以使用任何你想要的音频文件格式,例如 FLAC 或 24 位 WAV 以获得更高的质量,或者使用有损压缩格式如 Ogg Vorbis 或 MP3 来在磁盘上塞入更多歌曲。你受限于你选择的软件媒体播放器,而如今,几乎所有的软件媒体播放器都支持所有类型的文件。

你应该在 CD 播放器中验证 CD-R 和 CD-RW 的支持情况。CD-RWs 非常适合创建派对和特殊活动的临时收藏,但有些 CD 播放器处理它们并不好。有些甚至处理 CD-R 也不太好,但这种情况现在已经很少见了。一些新的 CD/DVD 播放器支持非红皮书格式,如 MP3、WAV 和 WMA。

注意

我们的优秀技术审稿人 Alvin 解释了为什么老式 CD 播放器在读取新光盘时会出现问题。“基于叠氮化物的旧光盘反射率差异很大,播放器的灵敏度被设置为这个大差异。对于 CD-RW 和基于酞菁(银)的光盘,0 和 1(烧录与未烧录)光盘的反射率差异要小得多。”

没有特殊的音频 CD

我之前已经说过,现在再说一遍:所有空白光盘都是完全相同的类型;商店里即使看到所谓的特殊音频光盘,实际上并不存在。它们唯一特殊的地方是作为串行复制管理系统(SCMS)一部分的压制数据标志,用于控制复制受保护材料,以及向美国录音工业协会(RIAA)或其在他国的等效机构支付的复制税。SCMS 编码控制三种状态:允许复制(00)、单次复制(11)和禁止复制(10)。如果你尝试使用连接到你的立体声系统的 CD 播放器来复制商业 CD,可能会遇到障碍。但你可以随意复制原始光盘,计算机硬件和媒体不受 SCMS 合规性的约束。

不同品牌之间存在着质量差异,制造光盘使用的材料也不同。太阳公司(Taiyo Yuden)自己制造光盘;它们非常好,并且承诺最长的使用寿命。三井、飞利浦、柯达、Verbatim 和 TDK 都是可靠的。好品牌和不太好的品牌之间的价格差异并不显著。没有必要节省每一分钱,因为使用质量较差的品牌只会产生更多的废盘,这样你实际上并不会省钱。想了解有关 CD 媒体的更多信息,请参阅 Andy McFadden 的 CD-Recordable FAQ(www.cdrfaq.org/faq.html)。

将 MP3 转换为 Red Book CD

常见的问题是“我如何将我的 MP3 复制到任何 CD 播放器都能播放的 CD 上?”它们必须转换为 16/44.1 WAV 文件,然后进行 Red Book 编码。为此,使用 Audacity 将 MP3 转换为 16/44.1 WAV 格式,然后在你的 CD 刻录程序中选择“创建音频 CD”。它不会给你 WAV 质量;它仍然会是低音质的、有损的 MP3 质量。即使文件大小较小,你的光盘上也不会超过 80 分钟的音乐。但你会得到一个标准 CD,可以在任何地方播放。

CD 刻录机和软件

现在,大多数消费级 CD/DVD 刻录机都相当不错,而且价格并不昂贵,大约 40 到 90 美元。外置 USB 刻录机是便携式的,有些是总线供电的,因此你不需要电源线。

CD 刻录软件到处都是。对于基本的 CD 刻录,你不需要付费,因为有很多免费软件。Windows 内置了 CD/DVD 刻录软件,尽管功能相当有限。Nero 和 Roxio 都相当不错,提供经济版。对于更高级的任务,索尼的 Creative Software CD Architect(仅限 Windows)在不到 100 美元的 CD 母带制作程序中提供了合理的价值,具有诸如交叉淡入淡出、音轨索引、长播放列表预览、抖动、重采样、卡拉 OK 和 DJ 混音等专业功能。

Linux 用户可以从三个优秀的图形开源应用程序中选择:Brasero、Gnome CD Master 和 K3b。它们都是 wodim、cdrdao 以及各种编码器和转换器等强大命令行应用程序的图形前端。当然,它们可以在没有漂亮的图形界面的情况下单独使用。

无缝刻录是 DIY 音频圈中常见的问题。这意味着创建一张播放一个长而连续的音轨的 CD,就像现场表演一样,歌曲之间没有间隔。这可以从多个音频文件或单个长 WAV 文件中组合而成。你需要一个支持无缝刻录的 CD 刻录机,现在应该所有 CD/DVD 刻录机都支持。寻找一次会话(SAO)和一次光盘(DAO)的支持。一次音轨(TAO)意味着激光在每个音轨的末尾暂停。SAO 在一次通过中烧录整个会话,没有暂停,并保持 CD 开放以便你可以添加更多音轨,而 DAO 则关闭光盘。使用 SAO 或 DAO 进行音频 CD 的无缝刻录。

对于 CD 刻录软件来说,一个额外的挑战是为一场漫长且不间断的表演创建曲目索引。在 Audacity 中创建一个长的 WAV 音轨,然后在你的 CD 刻录程序中创建 CD 文本和曲目索引,这样你就可以像在多首歌曲的 CD 上一样导航光盘。(你无法在 Audacity 中创建这个。)你应该最终得到两个文件:一个.bin文件,其中包含你的音频,以及一个.cue.toc文件,其中包含光盘索引。一些 CD 刻录应用程序使用他们自己的奇怪的非标准 cue 表格式;小心这些,因为其他 CD 刻录程序可能无法使用它们,并且它们可能会混淆播放设备。

Roxio、CDRWin、索尼的 Creative Software CD Architect 以及 Steinberg 和 Minnetonka 的高端套件是一些可以为 Windows 用户做这件事的程序。Brasero 和 Gnome CD Master 对 Linux 用户来说做得最好。K3b 可以索引长音轨,但它的界面做这件事相当繁琐。

在 Audacity 中制作 CD 汇编的三种方法

在 Audacity 中创建 CD 汇编有几种方法。一种方法是将每首歌曲复制到一个单独的 Audacity 项目中,每首歌曲都在自己的单独音轨上。单独编辑和修复每个音轨,然后对所有音轨进行归一化是一个步骤。给每个音轨起一个自己的名字,这就是你的歌曲标题。这是一个创建典型的音频 CD 的好方法,CD 上有多个歌曲音轨,每首歌曲之间有一个短暂的静音间隔。

另一种方法是将所有歌曲复制到单个立体声 Audacity 音轨中,应用修复和编辑,然后创建一个标签音轨来将它们分成单个歌曲。你可以通过在每首歌之间创建平滑的过渡,并在刻录 CD 时确保歌曲之间没有间隔,来创建看起来像是一个单一长而连续音轨的 CD。

使用前两种方法,你的最终结果是成批的 WAV 文件,每首歌曲一个文件。

第三种方法是将所有歌曲复制到一个单声道 Audacity 轨道中,并应用编辑和修复。将其导出为单个 16/44.1 WAV 文件,然后使用您的 CD 刻录程序创建歌曲标题,并在每首歌曲之间添加两秒的间隔,或者索引轨道以保持其连续性但仍然可导航。

每种方法都有其优点,所以让我们详细看看每一种。

每首歌曲一个轨道项目

我喜欢这种方法来创建具有多个歌曲轨道和标准两秒静音间隔的 CD。您可以一次性归一化所有轨道,并单独编辑每个轨道,而不用担心意外更改其他内容。当您的项目中的每首歌曲都在自己的轨道上时,它看起来就像图 5-1。

您的第一步是通过选择文件 > 另存为项目来创建一个新的 Audacity 项目。接下来,使用以下设置配置 Audacity 以创建 CD 就绪的 WAV 文件。

在选择工具栏中将帧率设置为 CD 音频,如图图 5-2 所示。这确保了您所做的任何分割都将从 CD 帧开始和结束。任何落在这些帧之外的音频将丢失,并可能产生点击噪音。您可以选择 hh:mm:ss + CDDA 帧(75 fps)或 CDDA 帧(75 fps)。前者显示时间加上 CD 帧,后者仅显示 CD 帧。勾选“吸附到”框以确保停止和开始总是在 CD 帧边界上。将项目速率值设置为 44,100 Hz。

将每首歌曲放在单独的轨道上

图 5-1. 将每首歌曲放在单独的轨道上

在选择工具栏中选择 CD 帧率和项目速率

图 5-2. 在选择工具栏中选择 CD 帧率和项目速率

现在打开编辑 > 首选项 > 录音对话框,确保“叠加:录制新轨道时播放其他轨道”和“软件回放:录音或监控新轨道时收听”未勾选。

编辑 > 首选项 > 设备对话框中,将通道设置为 2(立体声)。

现在将一些音频文件添加到您的项目中。要添加 WAV、FLAC 或其他格式的音频文件,请选择文件 > 导入 > 音频。如果您想从另一个 Audacity 项目复制轨道或剪辑,请在新窗口中打开该项目并复制粘贴。

在轨道菜单中将每个轨道命名为歌曲名称。(在导出时,每个轨道将导出为使用轨道名称作为文件名的单独 WAV 文件。)

接下来,应用编辑和修复。(参见修复和清理中的修复和清理。)我喜欢在每个轨道的开始和结束处放置一秒的静音,并将它们全部归一化到 0 dB。然后,当我构建 CD 级 WAV 集合时,它们都准备好了,不需要在 Audacity 中进行更多处理。

确保你的项目采样率设置仍然是 44,100 Hz。如果你打开或导入的第一个轨道的采样率不同,那么它将成为项目采样率。如果你有混合的采样率,这无关紧要,因为所有内容在导出时都会被重新采样到项目采样率。

在这个阶段,你可以选择通过打开文件 > 打开元数据编辑器来输入一些元数据。你可以输入诸如专辑标题、年份、流派和评论等信息。这些信息仅保存在你的 Audacity 项目中,因为 WAV 文件不支持元数据。(其他音频文件格式支持,例如 FLAC、MP3 和 Ogg Theora。)Audacity 将自动填写每个轨道标题、轨道编号以及你在元数据编辑器中输入的所有内容。

如果你想要在导出时查看每首歌曲的元数据,请打开编辑 > 首选项 > 导入/导出并勾选“在导出步骤之前显示元数据编辑器”。

现在你已经准备好导出你的轨道以进行 CD 录制。如果你需要复习多轨道导出的方法,请回到最终导出。确保点击选项按钮来设置正确的导出格式。

点击确定然后导出。你将看到每首歌曲的确认信息,完成时将显示摘要,如图 5-3 所示。

成功多导出

图 5-3. 成功的多导出

现在你有一批准备好的 CD 级 WAV 文件。使用你喜欢的 CD 刻录程序创建音频 CD,并确保创建一个音频项目,而不是数据项目。大多数 CD 软件支持 CD 文本和调整歌曲之间的间隔。请注意默认的两秒间隔设置,这将在 Audacity 创建的任何间隔上增加。

单个 Audacity 轨道汇编项目

对于这种方法,当你完成编辑并准备好导出时,你的 Audacity 屏幕将看起来像图 5-4。为什么这样做?我认为这样更容易控制歌曲之间的淡入淡出和过渡,而且我喜欢所有内容都在一个轨道中。这是我最喜欢的创建无中断歌曲之间的现场 CD 的方法。

这个汇编包括了来自各种来源的歌曲,所有这些都编织成了一个 Audacity 轨道。

图 5-4。这个汇编包括了来自各种来源的歌曲,所有这些都编织在一个 Audacity 音轨中。

您的第一步,一如既往,是使用文件 > 另存为创建一个新的 Audacity 项目。接下来,按照上一节的做法,配置 Audacity 以创建 CD 就绪的 WAV 文件。

在选择工具栏中将帧率设置为 CD 音频,如图图 5-2 所示。这确保您所做的任何分割都将从 CD 帧开始并结束。任何落在这些帧之外的音频都将丢失,并可能产生点击噪音。您可以选择 hh:mm:ss + CDDA 帧(75 fps)或 CDDA 帧(75 fps)。前者显示时间加上 CD 帧,后者仅显示 CD 帧。勾选“对齐到”框以确保停止和开始总是在 CD 帧边界上。将项目速率设置为 44,100 Hz。

现在打开编辑 > 首选项 > 录音对话框,确保“叠加:录制新音轨时播放其他音轨”和“软件回放:录制或监控新音轨时收听”没有勾选。

编辑 > 首选项 > 设备对话框中,将通道设置为 2(立体声)。

现在您可以在项目中添加一些音频音轨。如果您想从另一个 Audacity 项目中复制一些音轨,请使用文件 > 打开文件 > 最近文件在单独的 Audacity 窗口中打开它,然后复制和粘贴。要添加 WAV、FLAC、Ogg Theora 等音频文件,请选择文件 > 导入 > 音频。每个新导入都会在它自己的音轨中打开,因此您必须将其剪切并粘贴到您的汇编音轨中,然后删除多余的音轨。

当您有了所有想要的曲目后,应用编辑和修复(参见修复和清理)。如果您的歌曲音量不同,并且您希望它们都一样,您将不得不使用效果 > 放大逐个调整每个曲目。逐个选择每个曲目,然后将它们提升到您想要的峰值幅度,不超过零。

现在创建一个标签音轨。这是每个歌曲获得标题的方式,也是如何将这个长音轨分割成许多单独的歌曲文件。首先按 home 键确保您在非常开始的位置,然后按 ctrl-B 创建标签。输入歌曲标题并按回车键。在第二首歌的开始处点击,创建另一个标签,然后继续,直到您完成所有歌曲的标签(图 5-5).

创建标签音轨

图 5-5。创建标签音轨

确保在选择工具栏中的项目速率仍然是 44,100 Hz。任何具有不同采样率的剪辑在导出时都会被重新采样到项目速率。

如果你愿意,可以输入一些元数据,但请记住,这些信息仅保存在你的 Audacity 项目中——WAV 文件不支持元数据。要导出你的项目以进行 CD 录制,请参阅最终导出中的最终导出。完成时,你将看到每个歌曲的确认信息以及图 5-3 中的摘要。

单个 Audacity 轨道 + CD 刻录程序

这第三种方法需要一个支持 CD 文本、轨道分割和轨道间距控制的优秀 CD 刻录程序。想法是创建一个包含所有歌曲的单个长 Audacity 轨道,并在 Audacity 中进行清理和修复。然后将其导出为单个 16/44.1 WAV 文件,并使用你的 CD 刻录程序来创建歌曲标题,将轨道分割成单个歌曲并调整歌曲间的间隔,或者创建一个索引而不打断轨道。

有许多 CD 刻录应用程序可以做到这一点,例如 Roxio、CDRWin、索尼的 Creative Software CD Architect 以及 Steinberg 和 Minnetonka 为 Windows 用户提供的更高端套件。对于 Linux 用户来说,Brasero 和 Gnome CD Master 是最好的选择。

让我们用 Brasero 来演示如何进行这项操作,因为它拥有最简单的界面。首先,创建你的新音频项目并加载你的音频文件。然后右键点击你的文件并点击分割文件。这会打开 Brasero 的分割轨道窗口(图 5-6

图 5-6. 使用 Brasero 分割长轨道

通过拖动播放滑块来快速找到分割点,或者只是放松一下,当合适的断点出现时点击切片按钮。

完成后,点击确定。这会带到一个类似于图 5-7 的窗口,在那里你可以输入你的轨道标题,然后你可以创建一个可用于任何 CD 刻录应用程序的磁盘镜像和 cue 表,或者直接刻录到光盘。

输入歌曲标题并准备刻录到光盘,或创建一个可用于任何 CD 刻录程序的.bin 图像和.cue 文件

图 5-7. 输入歌曲标题并准备刻录到光盘,或创建任何 CD 刻录程序都可以使用的.bin 图像和.cue 文件

这个例子创建了一个没有歌曲间隔的长曲目。如果您想插入歌曲间隔怎么办?不用担心:只需右键单击任何曲目以插入两秒的暂停(图 5-8)。

使用 Brasero 在歌曲之间插入间隔

图 5-8. 使用 Brasero 在歌曲之间插入间隔

如果您长曲目是由带有通常静音间隔的歌曲组成的汇编,请尝试选择方法:为每个静音选择分割曲目。然后它会自动分割。

当然,其他 CD 制作应用程序也有自己的方式,但这应该能给您一个基本步骤的概念。

CD 提示单和 BIN 文件

提示单与.bin图像文件一起使用,这些文件包含您的音频,任何 CD 刻录软件都可以使用它来刻录新的 CD。提示单包含光盘的目录表,如下所示,由 Brasero 创建:

FILE "/home/alrac/winding-road-1.bin" MOTOROLA
TITLE "Audio disc (26 June 10)"
TRACK 01 AUDIO
      TITLE "Guitar Summit"
      PERFORMER "Winding Road"
      INDEX 01 00:00:00
TRACK 02 AUDIO
      TITLE "Gone Away Again"
      PERFORMER "Winding Road"
      INDEX 01 02:50:24
TRACK 03 AUDIO
      TITLE "Tennessee Waltz"
      PERFORMER "Winding Road"
      INDEX 01 06:45:63
TRACK 04 AUDIO
      TITLE "Montana Two-Step"
      PERFORMER "Winding Road"
      INDEX 01 14:30:72

提示单在 CD 和 DVD 上都会使用。如果您喜欢从商业 CD 和 DVD 中抓取,您可能已经了解提示单,因为一些抓取软件可以从 CD 上的目录(TOC)创建它们。您可以自己创建和编辑这些内容,尽管我很懒,更喜欢让一些好的 CD 制作软件为我完成。以下是最常用的字段,包括一些在 Brasero 示例中没有使用的字段:

表演者

艺术家或团体

文件

对应的磁盘映像文件的名称,包括文件类型。MOTOROLA 是一种二进制文件。其他选项是 BINARY、WAVE、AIFF 和 MP3。

标题

光盘标题

曲目

轨道号和数据模式,即 AUDIO

标题

曲目标题

索引

数字 01 标记曲目的开始。时间值是分钟、秒和 CD 帧。 (记住,在 Audacity 中,我们总是在选择工具栏中设置时间参数为 CDDA 帧。)索引值为 00 创建一个隐藏曲目,这可能是您在您自己的某些 CD 上体验过的花招。

前间隙

在曲目开始前插入多少秒的静音;例如,00:02:00 是两秒。

后间隙

在曲目结束后插入多少秒的静音。

您不必使用提示单。您甚至不必了解任何关于它们的信息。它们只是您 CD 和 DVD 制作工具包中的另一个可选项目,帮助您控制要放入光盘的内容。如果您想了解更多信息,互联网上到处都是各种免费教程。

修复和清理

第四章 包含了大量关于清理现场音轨的信息,其中很多也适用于清理汇编 CD。在这里,我们将回顾基本知识,并解释一些其他修复方法,这些方法可能在制作汇编光盘时出现。我们将讨论如何分割立体声音轨以进行更精确的编辑、标准化、调整歌曲之间的间隔以及平滑过渡。参见第十二章 了解更多关于修复和清理的信息,例如噪声消除;动态范围压缩;以及修复点击、爆裂、削波和其他缺陷。第十一章 全部关于应用特殊效果。

分割立体声音轨进行手术修复

有时,两个通道立体声音轨中只有一个通道会有缺陷。如果你将其分割成两个音轨,那么你可以只对其中一个通道进行修复,然后将其重新组合。这样做有几个优点:第二个音轨有助于掩盖不太完美的修复,而你应用于缺陷部分的修复可能不会帮助其他通道听起来更好,甚至可能损害音质。

要分割立体声音轨,请转到音轨菜单并点击分割立体声音轨。要重新组合音轨,请使用顶部音轨的音轨菜单并点击制作立体声音轨。两个音轨必须相邻。

标准化

标准化,即将所有不同的歌曲提升到相同的音量级别,是 CD 刻录软件中常见的音频编辑任务。但在 Audacity 中,你拥有更多的控制。

在进行标准化之前,你应该检查你的音轨,看看是否有任何异常峰值,这可能表明某种缺陷,例如麦克风碰撞、咳嗽、掉落的东西,或者任何声音太大而不正常的情况。标准化不会改变动态范围,所以一个太响的峰值意味着标准化不会有太大效果,你可能会得到一个整体音量太小的音轨。要降低任何太响的峰值,放大直到你可以精确选择它,然后打开效果 > 放大。输入一个负值,如-3 dB,以降低音量。你可以使用预览按钮来帮助调整。当它听起来正确时,点击确定,然后继续下一个。

如果你将整个项目放入单个 Audacity 音轨中,你必须仔细选择每首歌并将其提升到所需的最高音量级别。你应该在创建任何淡入淡出之前做这件事。另一种处理方法是使用包络工具,这样你就可以用一个工具修复所有内容。

当每首歌都在自己的单独音轨上时,操作会更简单——选择所有音轨(ctrl-A 或 编辑 > 全选),然后点击效果 > 标准化。检查“移除任何 CD 偏移”和“标准化最大幅度到”,并输入你的最大音量级别,最高可达 0 dB。

制作优雅的淡入淡出和歌曲中断

在 Audacity 中创建歌曲间的中断,带有优雅的淡入淡出,很容易。许多 CD 刻录程序也能做到这一点,但在 Audacity 中你拥有更多的控制。有三个 Audacity 工具我喜欢使用:淡入/淡出效果、包络工具和静音生成器。

淡入/淡出效果快速简单;你所能控制的就是淡入淡出的长度。首先,选择你想要淡入淡出的部分,然后选择效果 > 淡出效果 > 淡入

如果你需要插入一段纯静音,使用选择工具标记你想要静音开始的位置,点击生成 > 静音,设置你想要的持续时间,然后点击确定

包络工具让你对淡入淡出的持续时间和程度有更多的控制。图 5-9 展示了它的实际应用,创建了一个大约 2.5 秒的淡出到静音,然后再次淡入。那些小方块是节点控制点。通过点击音轨创建这些节点,然后你可以水平或垂直移动它们。要移除一个节点,抓住控制点并将其拖出音轨的边界。包络工具在大多数音频编辑应用中都是标准的。掌握它们需要一点练习,但一旦你弄清楚如何让它们按照你的意愿移动,你就能对淡入淡出和振幅有高度的控制。

你问及交叉淡入淡出如何?交叉淡入淡出是指一个音轨淡出同时另一个音轨淡入,有一定的重叠且没有中断。交叉淡入淡出在音轨和音乐中经常被使用。一些 Audacity 插件用于创建交叉淡入淡出包含在标准附加插件包中,但它们相当有限。我认为使用包络工具更容易且更好。总有一天 Audacity 会拥有一个优秀的交叉淡入淡出工具。同时,图 5-10 展示了我的首选方法。

使用包络工具和时间移动工具创建淡入和淡出

图 5-9. 使用包络工具和时间移动工具创建淡入和淡出

使用包络工具创建交叉淡入淡出

图 5-10. 使用包络工具创建交叉淡入淡出

这显示了两个 Audacity 立体声轨道。让我们称上面的为 Song1,下面的为 Song2。使用时间移动工具将 Song2 定位到所需的重叠长度;然后使用每个轨道上的包络工具设置淡入淡出的长度和程度。当它正好符合你的要求时,你必须将两个轨道混合成一个单一的立体声轨道。如果你想在项目中创建很多交叉淡入淡出,可以使用两个独立的 Audacity 轨道,如图 5-11 所示。然后你只需要混音一次。

通过使用时间移动工具和包络工具创建每首歌之间的交叉淡入淡出

图 5-11. 通过使用时间移动工具和包络工具创建每首歌之间的交叉淡入淡出

点击轨道 > 混音和渲染,将你的轨道在 Audacity 项目中混合成一个单一的立体声轨道,替换原始轨道。然后你可以在导出前进行进一步的调整,例如创建标签、进行修复和其他编辑。这将听起来就像 Audacity 中的播放一样,所以当它在 Audacity 中听起来正确时,就可以发布了。通道分配在轨道菜单中控制:左、右和单声道。左是通道 1,右是通道 2,单声道轨道混合到两个通道中。(如果你想让 Audacity 创建一个不替换原始轨道的新立体声轨道,请记住使用 ctrl-shift-M。)

请记住,合并轨道会使它们更响亮,所以点击视图 > 显示削波以快速找到任何削波段落。如果混音创建削波,请撤销操作,使用归一化或放大效果(效果菜单)来降低轨道的幅度,然后再次尝试。如果你降低得太低,你总是可以通过使用效果 > 归一化放大来提高最终混合轨道的音量。

请参阅第九章以了解更多关于多轨编辑和混音的信息。

为橙皮书 CD 配置 Audacity

橙皮书 CD 是普通的数据 CD,没有特殊的音频编码。这些可以在任何电脑上播放,但不能在大多数独立的 CD 播放器中播放,比如你的汽车或立体声音响系统。你可以在这些 CD 上混合不同的音频文件格式,并在 CD 上获得更多的音乐分钟数。

编辑 > 首选项 > 设备对话框中,选择 2 个通道(立体声)。

编辑 > 首选项 > 录音对话框中,取消勾选“覆盖录音:录制新轨道时播放其他轨道”和“软件回放:录音或监控新轨道时监听。”

在选择工具栏中,选择 CDDA 帧(75 fps)并勾选“吸附到”框(图 5-2)。

汇编一本橙皮书 CD 收藏集

如果你已经有一批准备复制到 CD 的音频文件,你根本不需要 Audacity。只需打开你的 CD 刻录器,创建一个新的数据 CD 项目。将你的文件复制到 CD 上,如果你想输入 CD 文本,就输入,然后刻录光盘,任务完成。

在 Audacity 中组装 Orange Book CD 项目有几种不同的方法。记住,你的音频文件被视为普通数据文件,因此你可以使用你的媒体播放器支持的任何音频文件格式。如果 CD 将包含所有相同的格式和质量设置,例如所有 FLAC、所有 Ogg Vorbis 或所有 MP3,你可以遵循与 Red Book CD 相同的步骤,即创建一个包含所有歌曲的单一 Audacity 项目。导出为你的所需格式和质量。然后在你的 CD 刻录程序中,选择“创建数据 CD”而不是创建音频 CD。如果你创建了曲目元数据,它将在支持它的 CD 播放器中显示(除了 WAV 文件,它不支持存储元数据)。

你打开的第一个音频文件将设置项目速率。你可以将音频文件重新采样到不同的采样率,但这可能会损害音频质量。上采样不会增加更多质量,只是增加更多位。下采样会丢弃位。一个好的策略是在 Audacity 中不混合文件,而是编辑单个 Audacity 项目中具有相同采样率的文件。导出后,你可以随意混合匹配它们。

你无法在你的 CD 刻录程序中应用标准化或调整曲目之间的间隔,因为它不会将这些文件视为音频文件。在 Audacity 中应用标准化,并确保每首曲目都标准化到相同的水平,如 0 dB 或你喜欢的任何水平。在 Audacity 中按照常规方式调整歌曲之间的间隔,使用淡入淡出和静音。

图 5-12 显示了在 Amarok 中播放 CD 时的元数据外观,Amarok 是一个开源的跨平台媒体播放器。汇编包括 FLAC、WAV 和 MP3 文件的混合,Amarok 可以轻松处理。基本上,任何计算机媒体播放器都应该做同样的事情。FLAC 格式在文件大小为 WAV 的三分之一到一半的情况下提供 WAV 质量,并且支持元数据。

A mixed FLAC, MP3, and WAV CD compilation in Amarok

图 5-12. 在 Amarok 中混合 FLAC、MP3 和 WAV CD 汇编

文件格式和质量设置

有许多不同的音频文件格式;WAV 和 FLAC 是最高质量的优秀选择,而 Ogg Vorbis 和 MP3 在你需要节省空间时是好的有损压缩格式。

Orange Book CD 支持所有 WAV 文件,因此你可以使用 16 位或 24 位以及你喜欢的任何采样率。

在线音乐服务如 Magnatune、Pristine Classical 和 Grooveshark 提供 FLAC 格式的下载,因为它的质量与 WAV 相当,但文件大小更小。

FLAC 支持从 16 位到 24 位的深度,并拥有九种压缩级别,从 0 到 8 (图 5-13). 默认值为 5,这是一个很好的选择,尽管如果你尝试其他设置,也不会有人介意。不同的设置代表不同的压缩级别,其中 0 是压缩最少,8 是压缩最多。FLAC 是无损格式,因此质量上没有区别,只是文件压缩的程度不同。值 8 相比于 5 需要花费数倍的时间进行编码,但额外的好处并不多。解码最大压缩的 FLAC 文件与解码轻度压缩的文件所需时间相同,因此压缩程度不会影响播放。

Ogg Vorbis 也是一种开放且不受限制的格式。在 Audacity 中有 11 个质量设置,从 0 到 10 (图 5-14). 值 3 大约相当于 128 Kbps 的 MP3,这相当低音质。我认为 6 对音乐来说很好。Ogg Vorbis 在 5 级别及以下使用通道耦合,这意味着两个立体声通道之间的冗余被组合起来以节省带宽,因此你可能会注意到立体声图像的损失。6 级别及以上不使用通道耦合。我认为超过 7 级别没有感知到任何增益,尽管你的耳朵可能会有不同的感受。

FLAC 格式无损且是 Orange Book CD 的绝佳选择

图 5-13. FLAC 格式无损且是 Orange Book CD 的绝佳选择。

Ogg Vorbis 是一种高质量的有损、压缩音频格式。

图 5-14. Ogg Vorbis 是一种高质量的有损、压缩音频格式。

MP3 是一个封闭的、专有的格式,存在专利限制,尽管我没有听说过小规模音乐家因为版税而被起诉。无论如何,没有人会知道你在自己的个人音乐光盘上使用的是什么。

MP3 支持可变和固定比特率。固定比特率最适合网络流媒体。可变比特率的 MP3 对于 Orange Book CD 来说很好,因为它们通常比固定比特率的文件听起来更好。固定比特率意味着整个文件使用相同的固定比特率,即使某些段落需要更多或更少的比特。可变比特率在您选择的范围内运行,根据需要使用更多或更少的比特。对我来说,170 到 210 Kbps 的可变比特率 MP3 听起来和更高比特率的 MP3 一样好,而且比低比特率听起来更好 (图 5-15). 当然,最重要的是你的耳朵感到满意。

计算机媒体播放器

软件媒体播放器可以播放你扔给它们的任何音频文件格式。Windows 用户可以尝试使用 Windows Media Player、Winamp 或 VLC。Linux 用户可以从 VLC、Rhythmbox、Mplayer、Songbird、Xmms 或 Amarok 开始。软件媒体播放器有成百上千种,所以你应该能找到你喜欢的一种。

对我来说,170 到 210Kbps 的 MP3 听起来不错,比低比特率更好,和更高比特率一样好。

图 5-15.对我来说,170 到 210Kbps 的 MP3 听起来不错,比低比特率更好,和更高比特率一样好。

抓取 CD

从你自己的数字音频文件存档中复制粘贴到 Audacity 项目中很容易,但要从 CD 中抓取歌曲怎么办呢?CD 上的音频轨道是使用一种特殊的格式编写的,即 Red Book CD 音频标准,所以你不能直接从 CD 上复制歌曲,而必须使用特殊的数字音频提取器,或称CD 抓取器。一些 CD 刻录程序包括抓取器,例如 Nero(Windows 和 Linux)和 K3b(Linux)。所有平台都有大量的独立 CD 抓取器。例如,Windows 用户可以尝试使用 Windows Media Player、Audio Grabber 或出色的 Exact Audio Copy。Exact Audio Copy 有一点点学习曲线,但一旦你为你的系统设置好,它就既快又准确,并且比其他任何一种都能更好地处理损坏的 CD。Linux 用户有,包括许多其他优秀的软件,如 Grip、KAudiocreator 和 VLC 媒体播放器。

CD 抓取器可以直接从 CD 中提取音轨,因此你不需要声卡。这就是制作一个真正的、100%忠实于原始版本的克隆的方法。你也可以通过各种方式截取播放信号并记录下来,例如直接使用其 RCA 连接器将 CD 播放器连接到录音接口,使用立体声放大器的线路或耳机插孔,或者甚至将麦克风放在扬声器前面。但这些技术不会产生完美的副本;它们可能会引入一些缺陷,丢失一些保真度,或者引入一些改变,如不同的高音/低音曲线。这被称为模拟孔,这是娱乐行业的人发明的一个愚蠢的怪物,他们似乎对音频技术一无所知。你不需要是音频工程师就能理解,CD 上的数字比特最终命运是转换成我们可以听到的模拟信号,而我们听到的任何东西都可以被记录下来。

人们尝试了不同的策略来“关闭模拟漏洞”,例如引入故意扭曲和信号退化来阻止复制,通过立法削弱音频和视频播放器的功能,将播放与水印绑定,只有带有正确、批准的水印的信号才能播放,以及在设备中设置后门,允许供应商远程关闭它们或以其他方式控制它们。这是一场失败的军备竞赛,因为任何发明都可以被规避,而且顾客不愿意跳过高楼大厦只为听到他们的音乐。

音频 CD 很少受到版权保护,而且已经尝试过的几次都失败了。当发现索尼 BMG 的版权保护秘密安装在 Windows PC 上的 rootkits 违反了多个国家的法律并打开了安全漏洞时,索尼 BMG 相当尴尬。在美国,索尼 BMG 承认它违反了联邦法律,并不得不处理多起民事诉讼。这种所谓的版权保护对除了 Windows PC 以外的任何东西都不起作用,因此 Linux 和 Mac 用户以及独立 CD 播放器和大量 CD 复制机的所有者都没有受到影响。

拷贝器对于从自己的 CD 和即将绝版的商业 CD 中恢复轨道很有用。

注意

在这个“知识产权”保护狂热的时代(至少在美国),公平使用原则受到了打击。我不会提供法律建议,因为我没有资格,而且这也会变成一场抱怨。但我确实想提醒大家,忽视版权的另一个极端同样错误,而且不,我们没有权利免费得到一切。一个人在意识到自己正在获取不公平的利益时,并不需要法律天才。

专业的 CD 拷贝器主要针对 MP3 用户群,所以要注意你的文件格式。大多数 CD 和 DVD 拷贝器支持导出到多种不同的音频文件格式,如 Ogg、WAV、FLAC、AAC、WMA 和 MP3。为了获得最佳质量,始终拷贝原生格式,对于 Red Book CD 来说,这始终是 WAV。一旦你拷贝了你的轨道,你就可以像任何其他数字音频文件一样在 Audacity 中编辑它们,并将它们导出为任何你想要的格式。

拷贝 DVD

如果你想要从 DVD 中提取音频轨道,那么你需要一个 DVD 拷贝器。一些适用于 Linux 的不错 DVD 拷贝器有 K9copy、K3b、dvd::rip 和 VLC 媒体播放器。HandBrake 和 DVDFab 是不错的 Windows 拷贝器,VLC 也适用于 Windows。先试试 VLC;它是开源的,免费,并且功能最全面。使用 VLC,你可以将 DVD 音频轨道提取并转码成几乎任何格式。再次强调,通过拷贝到原生格式可以获得最佳质量,然后你可以使用 Audacity 将其导出为其他格式,如果你需要这样做的话。

第六章。制作超高保真音频 DVD

无标题图片

CD 音频就像黑胶唱片一样,是一种通用的音乐媒介。有大量的播放设备,即使在廉价的 CD 播放器上,音质也非常出色。但是,当您想要比音频 CD 更高的保真度或更大的存储容量时(比如在单个 DVD 上放七张 CD 的内容),您该怎么办呢?

您可能会觉得您被忽视了,因为所有的关注都集中在新的和更好的视频格式上,而唯一得到关注的音频爱好者只是 MP3 消费者。有损格式和低音质耳塞的便携式小设备得到了所有的荣耀,而音频爱好者却只能依赖过时的格式和技术,这些技术和格式多年没有进步。更糟糕的是,不断涌现的无效、敌对的 DRM(代表数字版权管理或数字限制管理——您可以选择)的愚蠢行为,就像白蚁在新房子里一样,侵扰着新的视频和音频播放技术。

幸运的是,对于拥有“金耳朵”的数字音频爱好者来说,有一些选择。在本章中,我们将探讨 DVD 音频。DVD 音频是 DVD 的一种特殊数字音频格式;它与 DVD 电影中使用的音频格式不同。由于它不如 CD 音频得到广泛支持,您将牺牲一些便携性,但许多家用和车载 DVD 播放器都支持它。

CD 音频仅支持双声道 16/44.1 声音。DVD 音频支持非常高的音频分辨率,最高可达 24/192,并支持多达六声道环绕声。从 1.3.3 版本开始,Audacity 也支持这些功能。

如果您不需要超级高保真度,您可以在 DVD 上存储大量音乐。您不需要任何特殊硬件来创建 DVD 音频光盘;您只需要一台普通的计算机 DVD 刻录机和空白 DVD 介质。您确实需要特殊的制作软件来创建正确的 DVD 光盘镜像,并且您必须使用 PCM 类型的音频文件格式,如 FLAC、WAV 和 AIFF。我喜欢 FLAC,因为它是一种开放、高质量的无损压缩格式,创建的文件比 WAV 和 AIFF 小 30%到 50%。

一些 DVD 制作软件的例子包括 DVD-AUDIO Solo Plus(Windows)、Minnetonka Audio Software discWelder(Mac 和 Windows)、Steinberg Wavelab(Windows)和 Linux 的 DVD Audio Tools。有关更多信息,请参阅导出到 16 位中的 DVD 音频制作软件。

注意

您可能想回顾第一章和第二章,以刷新使用 Audacity 和录音室基础知识。

WAV、AIFF 和 FLAC 是什么?

让 iPod 和 Zune 保持它们那些小巧、价格过高的低音质设备,因为还有整个高保真数字音频世界等待探索。正如我们在第三章中讨论的那样,数字音频在许多方面都优于模拟音频。Audacity 对三种高质量的 PCM 音频格式(WAV、AIFF 和 FLAC)提供原生支持。WAV 和 AIFF 几乎是同一件事。

波形音频格式 (WAV) 由 IBM 和微软从电子艺界(EA)和 Commodore-Amiga 在 1980 年代中期开发的交换文件格式(IFF)发展而来。IFF 可以携带文本、图像或音频数据,并且原本旨在成为跨不同平台交换不同类型数据的通用包装器。

音频交换文件格式 (AIFF) 由苹果公司开发,它也基于 IFF。WAV 和 AIFF 之间有一些小的技术差异,因为它们是为了在不同的操作系统上运行而开发的,但如今它们都得到了大多数软件媒体播放器的良好支持。

无损音频编解码器 (FLAC) 是一种高质量的无损压缩格式。它是一个开放且不受限制的标准。像 Magnatune、费城交响乐团在线音乐商店和 Linn Records 这样的在线音乐服务提供 FLAC 格式的下载,因为它的质量与 WAV 相当,但文件大小更小。FLAC 得到良好的支持,并且越来越受欢迎。

FLAC、WAV 和 AIFF 都是线性脉冲编码调制(LPCM)。线性意味着整数,我们将在在 Audacity 中创建高质量录音中详细讨论这一点。

这三种格式都是您的工作室主文件和最终输出的优秀选择。您可以制作它们的完美副本以进行存档和备份,并且您可以在有损格式(如 Ogg Vorbis 和 MP3)中生成低分辨率的副本。您的工作流程如下:

  1. 源材料,如现场录音或旧媒体副本,在 Audacity 中被转换为高分辨率的主文件。

  2. 生成 FLAC、WAV 或 AIFF 格式的播放文件。

  3. 使用特殊的制作软件将曲目写入 DVD。

DVD 音频概述

DVD-Audio 是 DVD 的数字音频格式。它不同于 DVD 电影中使用的音频格式,而是一个仅用于音频的不同格式。DVD 电影使用各种压缩、有损音频格式来节省磁盘空间,即使是在 DVD 上,当结合电影长度的视频和多声道环绕声时,磁盘空间也是宝贵的。DVD-Audio 支持专业录音室母带音频质量,为 24/192。如果您对 CD 音频(16/44.1 立体声)满意,您可以在单个标准 4.7GB DVD 上存储大约七个小时的内容。在 24/192 的情况下,您将在标准 DVD 上获得大约 75 分钟的音频。一些 DVD 制作软件支持写入 8.5GB 双层 DVD,因此您可以真正地堆叠音乐。DVD-Audio 标准还支持静态图片和视频菜单。

注意

有时在家烧录的双层 DVD 在不同的播放设备上可能不可靠。请坚持使用高质量的 DVD 空白盘,并确保您的 DVD 播放器支持双层 DVD-R 和 DVD-Audio。您的特定 DVD 刻录机可能与特定品牌的空白盘配合得更好,因此请使用制造商推荐的产品。

DVD-Audio 是一个类似于 WAV 和 AIFF 的 LPCM 格式。它支持 16 位、20 位和 24 位的比特深度,以及高达 192 kHz 的采样率。Audacity 支持 16 位和 24 位的比特深度以及几乎任何您想要的采样率。如果您想要的采样率不在编辑 > 首选项 > 质量对话框中,只需在编辑 > 首选项 > 质量 > 默认采样率 > 其他中输入自己的值。

DVD-Audio 的理论动态范围为 144 dB,但由于音频硬件的限制,您的最大动态范围始终约为 120 dB。在此上下文中,动态范围并不是指提高音量或用突然的极端峰值冲击听众;极宽动态范围的优势在于为录音和处理提供了大量的余量,并且噪声地板非常低。

DVD-Audio 支持 24 位立体声和环绕声通道组合的多种范围:1.0 单声道和 2.0 立体声,采样率为 44.1 kHz,48 kHz,88.2 kHz,96 kHz,176.4 kHz 和 192 kHz。

这些都支持 44.1 kHz,48 kHz,88.2 kHz 和 96 kHz 的采样率,以 24 位进行采样:

  • 2.1 立体声(左,右,低频效果声道)

  • 3.0 (左,右,环绕)

  • 3.1 (左,右,环绕,低频效果声道)

  • 4.0 (左,右,中置,环绕)

  • 4.1 (左,右,中置,环绕,低频效果声道)

  • 5.0 (左,右,中置,环绕右,环绕左)

  • 5.1 (左,右,中置,环绕右,环绕左,低频效果声道)

低频效果(LFE)声道需要稍作解释。它通常被认为是低音炮声道,但这并不完全正确。LFE 声道是一个特殊的声道,它携带 3 Hz 到 200 Hz 频率范围内的声音,并且 LFE 信号可以发送到任何能够处理这个频率范围的扬声器。

未压缩的 DVD-Audio 的比特率限制为 9.6Mbps,因此您可以拥有壮丽的 24/192 双声道立体声。但您不会在完全的 24/192 分辨率下获得未压缩的 5.1 环绕声,因为 9.6Mbps 的带宽不足以支持所有这些通道的全分辨率。您能得到的最优解是 5.1 的 24/96。您可以在不同的通道上使用不同的分辨率,例如两个前置通道为 24/96,环绕通道为 16/48。您需要压缩才能为 5.1 提供更高的分辨率,而 DVD-Audio 标准支持的唯一压缩是专有的 Meridian Lossless Packing (MLP)无损压缩。MLP 的许可证费用昂贵,通常超过 2000 美元,并且仅适用于 Windows 和 Mac 的编着软件。

在 Audacity 中创建高质量录音

您的起点是您能创建的最高质量的音频文件。这并不一定意味着以最高可能的采样率和比特率进行录音,而是使用良好的录音技术来制作听起来最好的录音。正如我们在第一章和第二章中讨论的那样,许多因素会影响您音频录音的质量:背景噪声、麦克风放置、麦克风的质量、前置放大器、模拟到数字转换器和您计算机的功率。

Audacity 支持高达 32/192 的录音,那么让我们看看使用更高分辨率的优势和劣势。

更多功能

您需要一个强大的 CPU 来处理高分辨率录音。我有一台装有 Athlon LE-1620 2.4 GHz 和 4GB RAM 的 PC。这是一颗单核 CPU,在采样率高于 48 kHz 时会变得缓慢。多核 CPU 非常适合音频制作。Audacity 没有设计用来利用多个核心,但您仍然会看到显著的性能提升,因为操作系统会使用那些额外的核心来处理其他任务,从而为 Audacity 释放 CPU 周期。我还有一台配备三核 CPU(AMD Phenom X3)的系统,它可以轻松处理 24/96 的八通道录音(使用 Focusrite Saffire Pro 26 I/O FireWire 录音接口)。

我没有注意到超过 4GB RAM 有任何优势,但内存如此便宜,加载起来也无妨。(参见第十三章和第十四章了解如何调整您的计算机以获得最佳音频性能。)

最佳比特深度是多少?

Audacity 文档建议以 32 位浮点录制,然后下采样到您所需的比特深度进行最终导出。因此,即使您的最终产品是 24 位或 16 位,从 32 位浮点开始录制比在 24 位或 16 位整数录制具有更高的质量。即使您的录音接口只支持 16 位,这也是正确的。您总是会下采样,因为没有 32 位播放设备;您必须始终导出为 24 位或更低的整数(也称为线性)格式。32 位浮点始终是一个中间步骤,而不是最终结果。

让我们来谈谈 32 位浮点数是什么,因为它被误解得相当严重。整数是整数,而浮点意味着浮动的十进制点。32 位浮点数是一个 24 位的尾数加上一个 8 位的指数。32 位浮点意味着极高的精度和非常高的分辨率。在整个模拟到数字转换的范围内,你将获得更平滑、更准确的响应曲线。

比特深度控制动态范围,在音频制作中动态范围非常重要。每个比特等于大约 6 分贝的动态范围。因此,16 位具有 96 分贝的动态范围,24 位是 144 分贝,32 位浮点约为 1,500 分贝;32 位整数是 196 分贝。电子硬件的限制限制了实际动态范围的最大值约为 120 分贝,大多数人不会关心听动态范围大于 50 分贝的音乐,这已经相当多了。那么,拥有非常宽的动态范围有什么意义呢?所有这些动态范围的价值是充足的编辑空间、最低的噪声、更低的削波风险以及无损导出到较低的比特深度。

当您进行大量操作和效果处理时,那额外的八个比特会带来很大的差异。您可以随心所欲地修改您的 32 位文件,完成后制作一个无损的 24 位导出。如果您从一个 24 位文件开始,应用了大量处理,并以 24 位导出结束,您可能会引入一些噪声并经历一些质量损失。

我们这些来自模拟时代的恐龙有一个习惯,就是尽可能地将录音电平推到红线附近,因为这样做有很好的理由。即使是最好的模拟磁带和录音机也会产生一些嘶嘶声,并且动态范围相对较窄,因此我们必须将信号与噪声的界限推到极限以最小化这一点。在模拟音频中,稍微超过红线并没有太大关系,因为这是一个渐进的效果——在+2 或+3 时,失真只会让最挑剔的听众感到烦恼。在+4 或+5 时,你就是一个酷摇滚乐队。在数字音频中,要么全有要么全无——当信号通过 0 dB 时,所有超过零的部分都会被丢弃或削平。你可能会听到可听见的点击声或类似熟悉的模拟失真嗡嗡声。你可以很容易地自己听到。只需插入一个麦克风,提高增益,大声说话。或者使用生成 > 音调来创建正弦波,然后使用效果 > 放大将其推到零以上。你可以通过选择查看 > 显示削波来轻松找到削波段,它会用红色条标记削波部分。

一些文档说明,在 32 位浮点下录音几乎不会有失真,即使你超过 0 dB。但影响任何超过 0 dB 的声音的变量有很多,主要是处理你的声音的软件。不同的 Audacity 插件或你可能使用的任何其他软件将以不同的方式处理超过 0 dB 的声音,所以你仍然可能会遇到削波并产生失真。但因为你有很多动态范围可以消耗,所以没有必要将录音电平推得那么高。

简而言之,16 位、24 位和 32 位深度都提供了比你能够使用的更多动态范围,所以你会有足够的余量。当你以 24 位深度录音时,你可以轻松地丢弃顶部 12 dB。在 16 位时,你可以将峰值设置为-6 或-9 dB 而不用担心。Audacity 的 32 位浮点意味着你可以将峰值记录到-24 dB,这对于现场表演中应对意外的峰值非常有帮助。

当然,在高比特深度和采样率下录音也有缺点。更高的分辨率会消耗更多的磁盘空间,并需要更多的 CPU 功率(表 6-1).

表 6-1. 不同比特深度/采样率组合每分钟立体声所需的磁盘空间

比特深度/采样率 每分钟立体声所需的磁盘空间
16/44.1 10MB
16/48 11MB
24/48 17MB
24/96 33 MB
24/192 66MB

如果你超载了 CPU,你会遇到断点,这听起来很糟糕。如果你喜欢跳音、爆音和模糊音,最好有意地添加它们作为特殊效果。

考虑你正在录制的复杂度。简单的语音录音,如有声书或播客,从超高的分辨率中获益不多。独唱歌手或乐器演奏者或小型乐队可以在 16/44.1kHz 下完美捕捉,而交响乐团会使用你拥有的所有东西。

所以,对于“哪个最好?”这个问题,答案依然是“这取决于”。如果你有足够的计算机功率和存储空间,以 32 位浮点格式以任何采样率进行录音都会给你提供大量的编辑和导出空间。你可以总是向下调整,但无法向上调整。另一方面,如果你小心且技艺高超,你音频链中的所有链接都是高质量的,而且你的耳朵对结果感到满意,那么较低的分辨率也足够好。有趣的是,你可以随心所欲地这样做。

什么采样率最好?

既然我们已经彻底讨论了比特深度,那么采样率呢?正如我们在第一章中学到的,采样率决定了频率范围。频率范围大约是采样率的一半。人类最好的听力范围大约是 20 Hz 到 22 kHz,所以 44.1 kHz 的采样率应该覆盖人类听力的范围。更好的音频硬件的上限是 20 到 30 kHz。

但事情并不那么简单。一些研究表明,非常高的频率仍然以某种方式被感知,并增加了听众的享受。他们可能谈论的是谐波。如果你有一个 100 Hz 的声音,那么这个声音在 25 Hz、50 Hz、200 Hz 等频率上都有谐波。当你限制频率范围时,你也限制了谐波。

如果你听力好,对音乐又挑剔,我敢打赌你会更喜欢 24 位而不是 16 位。根据我的经验,比特深度比采样率带来的差异更明显。当我想要最佳质量时,我会以 32 位浮点/48kHz 进行录音,并导出为 24/48kHz。不要提升采样率,因为这只会增加比特数而不增加质量,而且很可能会听起来稍微差一些。

保存你的母带

Audacity 项目 (.aup) 文件并不完全适合存档,因为每次编辑项目时它们都会改变。它们是快速高效的工作空间。但项目文件已知是脆弱的;如果项目损坏,你只能依靠 Audacity 的自动恢复机制来修复它。如果那失败了,游戏结束。一个存档你的工作室母带的好方法是导出为 WAV 或 FLAC 格式。最高质量是 32 位浮点 WAV。(选择文件 > 导出 > 选项。)这样你就不会丢失任何比特,并且始终拥有高质量的母带。FLAC 的最大值是 24 位整数,这仍然有很多比特,而且 FLAC 文件比 WAV 文件小。

多轨录音需要一些注意才能以 WAV 或 FLAC 格式保存,因为 Audacity 的轨道名称和通道映射在导出时会丢失,只保存在您的 Audacity 项目文件中。如果您将大型多轨项目导出为单个文件,您将获得所有轨道,但它们将没有轨道名称。相反,它们都将使用文件名。如果您选择导出 > 多个,这将每个轨道导出到单独的文件中,轨道名称将变为文件名。

我保存了 Audacity 项目文件和 32 位浮点 WAV 主文件。保存您的作品在保存您的作品中更详细地介绍了备份的制作。

创建 5.1 环绕

Audacity 1.3.8 及更高版本可以同时录制与您的声卡支持的以及您的计算机可以处理的轨道数量一样多的轨道。较旧的 Audacity 版本一次最多支持 16 个轨道。在编辑 > 首选项 > 设备中设置正确的轨道数量。如果您的录音接口支持的声道数量少于您想要录制的数量,您将不得不在多个会话中录制它们(参见第九章“多轨录音”)。

Audacity 1.3.3 及更高版本附带一个简单的多通道混音器界面,用于将您的轨道映射到正确的环绕声道,如图 6-1 所示。请确保底部的滑块设置为正确的输出声道数量。

简单的混音器和通道映射器

图 6-1. 简单混音器和通道映射器

如果您打开编辑 > 首选项 > 导入/导出对话框并选择“使用自定义混音”,则此混音器会自动出现。不幸的是,Audacity 不会告诉您哪个轨道将映射到哪个声道。因此,请使用此指南,它详细说明了 DVD 音频通道编号约定:

通道 1 前左
通道 2 前右
通道 3 中间
通道 4 低频效果(LFE)
通道 5 环绕左
通道 6 环绕右

为了避免让您自己发疯,请为您的轨道命名,以便您知道它们是什么(使用轨道菜单),如图 6-2 所示。您可以随意命名它们。

使用轨道菜单为您的轨道命名有用的名称

图 6-2. 使用轨道菜单为您的轨道命名有用的名称

然后,你会在混音器中看到音轨名称。然而,在图 6-3 中,两个前声道顺序错误。没问题——只需点击它们,将它们重新映射到正确的声道,并使它们看起来像图 6-4。

你的音轨名称显示在混音器中。

图 6-3. 你的音轨名称显示在混音器中。

修复顺序错误的音轨

图 6-4. 修复顺序错误的音轨

如果你想要从多声道项目中获取立体声,怎么办?没问题——只需更改混音器设置。按照图 6-5 中的示例,将六个声道映射到两个立体声声道,首先确保输出滑块设置为两个通道。音轨可以映射到多个声道。

将六声道离散环绕映射到立体声

图 6-5. 将六声道离散环绕映射到立体声

导出为 16 位

你可能会尝试在从 32 位或 24 位下采样到 16 位时应用一些dithering。这可以在编辑 > 首选项 > 质量 > 高质量转换下拉菜单中设置。Dither 是有意添加噪声来平滑粗糙边缘,以获得更干净的声音。Shaped dither 被认为能给出最佳结果,但它也是最占用 CPU 的。Triangular在质量和 CPU 成本之间提供了一个良好的折衷方案,而rectangular则轻量级且改动最小。在 24 位文件上不需要 dithering,尽管我不会抱怨如果你想要实验并亲自听一下。

DVD 音频制作软件

一旦你的 FLAC、WAV 或 AIFF 音频文件都准备好了,可以复制到 DVD 上,你需要的只是普通的空白 DVD,一台普通的计算机 DVD 刻录机,以及特殊的 DVD 音频制作软件。以下是一些示例:

DVD Audio Tools for Linux

我所知道的 Linux 只有一个 DVD 音频制作应用程序,那就是 DVD Audio Tools (www.dvd-audio.sourceforge.net/)。它既有命令行界面,也有友好的图形界面。它可以在 Linux 和 Windows 上运行,并且是免费软件(根据 GPL 许可)且免费。

DVD Audio Tools 简单且流程化——第一次使用它,你一个小时之内就应该能制作出一个可播放的 DVD。它接受 FLAC 和 WAV 文件。你也可以用它从未加密的 DVD 中“抓取”音频轨道。DVD Audio Tools 只创建磁盘镜像,所以你需要用你通常喜欢的 DVD 刻录应用程序来刻录磁盘。

DVD-AUDIO Solo Plus

Cirlinca 的 DVD-AUDIO Solo Plus (www.cirlinca.com/products.htm) 是一款不错的 Windows 程序,支持您想要做的几乎所有事情:它支持多声道环绕声、8.5GB 双层盘、无缝播放和未加密的 CD/DVD 抓取。目前,它的零售价约为 45 美元。Cirlinca 不提供 Meridian Lossless Packing (MLP)许可证。(MLP 是一种用于 DVD-Audio 的无损压缩专利方法。)

Minnetonka Audio Software discWelder

discWelder for Windows (www.minnetonkaaudio.com/) 有三个版本:青铜版、铬版和钢版。青铜版售价 99 美元,钢版 595 美元,铬版则需要 2995 美元带您回家。再花上 2000 美元,您就能获得 MLP。青铜版与 DVD-AUDIO Solo Plus 相当。钢版支持 8.5GB 双层盘和幻灯片图形,并让您完全控制混音和映射。按这个价格,Chrome 本应为您做早餐并打扫房子,但它并没有。相反,它增加了对动画图形的支持,让您同时拥有立体声和环绕声流,并支持导出到 DLT 磁带。还有 Mac 版本。

Steinberg Wavelab

Steinberg 的 Wavelab 7 (www.steinberg.net/en/products/wavelab.html) 有两个版本:Wavelab 7 售价约 500 美元,Wavelab Elements 7 售价约 100 美元。这两个版本都提供了大量音频编辑、母带制作、特殊效果、多声道环绕声和当然还有 DVD-Audio 的功能。

在您花费了所有这些金钱并经历了所有这些麻烦之后,您肯定不想用那些又脏又旧的亲手书写的磁盘标签,对吧?不,您不想,这就是您为什么要花几美元购买一款新的 LightScribe DVD 刻录机。这些刻录机的价格与普通的 DVD 刻录机相同,大约 50 美元或更少,您可以直接在磁盘上烧录花哨的磁盘标签。您必须购买 LightScribe DVD 空白盘,目前这些空白盘的价格略高于普通类型。Linux 和 Windows 都有用于创建标签的软件。

另一个选择是购买可喷墨打印的 DVD 空白盘,然后您就可以制作彩色标签。您需要一个带有特殊 CD/DVD 托盘的喷墨打印机来使用这些空白盘。

一支普通的毛笔也完全可以用来书写您的磁盘标签。

记住,您不想使用粘性纸标签,因为胶水会随着时间的推移损坏磁盘。

转移传统媒体

在第三章中,我们学习了如何将旧式模拟媒体转换为数字格式。磁带和黑胶唱片需要跳过一些额外的硬件障碍才能连接一切。CD 和 DVD 更容易,因为你可以用电脑完成所有操作。首先将 CD、DVD 或旧式媒体复制到你的电脑上。复制 CD 和 DVD 的流行术语是刻录,这可以通过特殊且容易获得的软件完成。Linux 中一些好的 DVD 刻录器有 K9copy、dvd::rip 和 VLC。你需要libdvdcss来刻录加密的 DVD。libdvdcss 在许多 Linux 发行版中可用,应该很容易找到。

HandBrake 是最佳的 Windows DVD 刻录器之一,它甚至有一个仅命令行的 Linux 版本。VLC 也运行在 Windows 上,DVD Fab Platinum 非常好。所有这些都允许你仅选择音频轨道。先尝试 VLC;它是开源的,免费的,并且具有最多的功能。使用 VLC,你可以提取和转码你的 DVD-Audio 轨道到几乎任何格式。

CD 刻录器众多。Linux 用户还可以尝试 K3B、KAudioCreator、Brasero、Asunder、SoundJuicer 和 Grip。Windows 用户还可以尝试 Windows Media Player、Audiograbber 和 Winamp。

将 CD 刻录到硬盘上的良好存档格式是 16 位 FLAC,而对于大多数 DVD-Audio 曲目来说,24 位 FLAC 是合适的。它制作出完美的副本并节省磁盘空间。如果你认为你将要编辑你刻录的曲目,考虑将它们存档为 32 位浮点 WAV 母盘,这样你就可以为未来的编辑留出一些空间。

关于 SACD 有什么说法?

音乐爱好者总是问“关于索尼/飞利浦的超级音频 CD(SACD)怎么样?”SACD 对于家庭或小型工作室来说不是一个选择,因为录音机非常昂贵,而且你必须支付格式许可费和专利费,这真是个遗憾,因为它是一个真正的突破。SACD 以 2.82 MHz 的采样率进行单比特采样。没错,每秒 2.82 百万次。这比标准红皮书 CD 采样率 44.1 kHz 略多。从纸面上看,它比任何其他数字格式更接近模拟波形。SACD 不使用脉冲编码调制(PCM),而是一种称为直接流数字(DSD)的新录音和播放方法。PCM 需要插值和过采样滤波器,而 DSD 采用更直接、更简单的信号路径。SACD 的潜在动态范围约为 100 dB。

看起来,SACD 和 DVD-Audio 的供应商都陷入了 DRM 的荒谬之中,而不是以令人愉悦和吸引人的方式推广这些高质量格式,因此这两种格式在市场上都进展缓慢。我认为它们最终都会逐渐消失。

了解更多

请参阅第一章和第二章以了解使用 Audacity 和设置录音室的基础知识,第九章用于多轨录音,以及第十二章用于修复和清理。

第七章。创建播客

无标题图片

多亏了互联网,每个人都在制作播客。现在,任何拥有一点录音设备和互联网连接的人都可以创建音频广播并与世界分享。您可以讲故事、报道新闻、分享教程。您的播客可以是您一个人说话,您采访另一个人,您和合办人,或者您和一群合办人和嘉宾。您可以添加音乐轨道或特殊效果。使用 Audacity 制作播客既简单又有趣。

一旦您创作了您的杰作,您需要一个网站来托管它,并使其对您渴望的观众可用。互联网上充满了免费和低成本的播客托管服务。如果您有足够的带宽,并想成为自己的服务器管理员,您可以通过大量的免费和开源流媒体服务器软件成为自己的托管者。

术语podcast曾经指的是为 iPod 下载的 MP3 编码录音。苹果公司曾短暂而猛烈地试图拥有单词pod,并对一些敢于使用该词的小企业发起了法律诉讼,例如 TightPod(笔记本电脑保护套)、Profit Pod(自动售货机数据收集器)、Spodradio(德国在线广播电台)和 Podcast Ready(另一家在线广播电台)。幸运的是,攻击律师们似乎已经转向了其他事情,现在可以说“pod”这个词了。所以,这就是我们要做的:豌豆荚、鲸鱼群、外星人。打开舱门,HAL。

Audacity 是制作播客的绝佳工具。您可以使用数字录音机,然后将录音导入 Audacity 进行编辑,或者您可以直接在电脑上录音。连接到上网本的无线电麦克风或耳机可以组成一个出色的轻便便携录音室。或者,您可能喜欢使用整个录音室中的昂贵设备;这完全取决于您。

到目前为止,在这本书中,我一直唠叨着高质量音频,不使用有损,压缩的音频文件格式。在播客中,我们走向了另一个方向:更小的文件大小和有损,压缩的格式。您仍然需要从创建高质量的主文件开始,但不需要像对待终极音响发烧友的音乐录音那样对待您的播客,因为它将被修剪以适应互联网流媒体和快速下载。

您可能需要先回顾第一章和第二章,以了解 Audacity 的基本使用方法和如何设置您的录音设备。

短篇小说

制作一个简单的播客只需几个步骤:

  1. 进行录音。

  2. 在 Audacity 中编辑它:修剪、修复、归一化——常规的清理和修复。

  3. 导出为可播放的压缩格式,如 Ogg Vorbis 或 MP3。

  4. 将其上传到您的粉丝可以下载和享受播客的网站。

让我们来看看制作优秀播客的细节。

注意

当涉及到定义轨道时,音频术语有些混乱。轨道可以是一个单声道轨道,一个立体声轨道,甚至是一个音轨。在 Audacity 中,将轨道视为任何单个可编辑的单位是有帮助的,这可以是任何单声道或立体声轨道。您所做的任何编辑,如删除、添加、特殊效果等,都将同样应用于 Audacity 立体声轨道的左右声道。

制作简单的语音播客

最简单的播客只是你在说话。听起来虽然简单,但对着麦克风说话需要一点练习。你可能需要在没有创建不想要的噪音(如拍打声、爆裂声、大声呼吸、咬合声或任何其他不愉快的声音)的情况下练习对着麦克风说话。注意避免口头习惯,如“嗯,啊,你知道。”练习调整你的嘴和麦克风之间的最佳距离,并设置它以便你可以舒适地站立或坐着。使用麦克风支架比手持更好,如果你使用的是领夹式麦克风,请将其夹在衣服不会摩擦到它的地方。我更喜欢高质量的 USB 耳机。对着麦克风说话时,就像你有一个在房间里的观众一样,而不是对着麦克风;这将帮助你使声音充满活力,并以减少不希望产生的副作用的方式投射声音。风屏或泡沫风罩是必不可少的。

你应该以多快的速度说话?这取决于你的个性和材料类型。通常,每分钟 120 个单词被认为是良好的速度,尽管这对大多数英语说话者来说可能感觉较慢。这并不意味着每秒两个单词的速度限制,但意味着放松并使用精心安排的停顿,以便听众有机会吸收你所说的内容。

我使用 Plantronics 立体声 USB 耳机进行语音录音 (图 7-1). 它佩戴舒适,使用方便,音质良好。USB 录音接口有自己的模拟-数字转换器,因此您不需要声卡。它们还可以消除拾取内部计算机噪声的风险,这在内部声卡中有时是一个问题。

一款好的 USB 耳机是制作语音录音的绝佳工具

图 7-1. 一款好的 USB 耳机是制作语音录音的绝佳工具。

在没有脚本或排练的情况下说话需要大量的练习,所以如果你需要它们,不要感到难过。尽可能制作尽可能干净的录音比清理一个充满糟糕内容的录音要好,你的听众会欣赏清晰、专注的展示。

Audacity 设置

首先使用 文件 > 另存为 创建一个新的 Audacity 项目。

然后在编辑 > 首选项 > 设备对话框中设置您的录音和播放设备,并将通道数设置为一次录制的数量。如果您只使用单声道麦克风,则设置一个通道。如果您使用立体声麦克风或耳机,则为两个。小心那些廉价的板载声卡,比如笔记本电脑上使用的那些——即使它们声称是立体声,麦克风输入通常也是单声道的。

编辑 > 首选项 > 质量对话框中,设置默认采样率为 44,100,默认采样格式(实际上是位深度;Audacity 有一些术语上的怪癖)为 32 位浮点。(有关位深度和采样率的更多信息,请参阅第一章

图 7-2. 设置录音电平

大多数 USB 耳机都附带 Windows 软件,允许您控制输入和输出音量。Linux 用户可能必须依赖 ALSA(请参阅第十三章

图 7-3. Audacity 混音工具栏

现在,你一直等待的时刻——点击录音按钮开始说话!图 7-4 显示了正在进行的语音录音。

点击暂停停止录音,点击录音将内容附加到现有轨道上。如果你先点击停止然后点击录音,你将创建一个新的轨道。如果你不小心点击了停止,可以使用 shift-Record 从上次停止的地方继续。

清理录音

一旦你记录下了你的深刻思考,你可以回过头来清理你的录音。首先,删除你不想保留的内容;在第一次遍历时进行粗略剪辑,并留下一些额外的空间。你总是可以删除更多,但很难轻易恢复。如果你有多个轨道,请注意保持它们同步(尽管如果它们失去了同步,也有简单的方法将它们重新组合在一起)。

然后选择视图 > 显示剪辑来用红色突出显示任何被剪辑的片段。如果你发现了一些,有几种方法可以修复它们。

如果是一个非常简短的剪辑,持续时间不到四分之一秒,放大直到你可以精确选择被剪辑的部分并删除它。当它只有几秒钟时,没有人会注意到。

最后,我们开始录音了!

图 7-4. 最后,我们开始录音了!

另一种方法是,在第二个轨道或 Audacity 窗口中重新录制被剪辑的片段到正确的录音水平,然后将其复制到被剪辑的片段上。替换短片段并不容易,所以你可能需要选择一个较长的部分来替换。寻找自然断点,这样你可以优雅地修补新部分,就像图 7-5 中所示。图 7-5 中的选择大约持续了四秒钟,尽管被剪辑的部分(由六秒标记和六秒半标记之间的三个垂直峰值表示)的持续时间不到半秒。

通过选择在自然断点处替换的片段来制作更平滑的补丁

图 7-5. 通过选择在自然断点处替换的片段来制作更平滑的补丁

现在有一个我很喜欢的技巧,因为它帮助我跟踪我在哪里编辑。如果你非常熟悉 Audacity,你知道鼠标的滑动或意外按下快捷键会丢失你的位置,如果是一条长轨道,回到原来的地方会很痛苦。所以,不要删除你的选择,而是使用编辑>拆分删除。这会将选择替换为一个空隙,就像图 7-6 中所示。这也保持了你的轨道长度不变,如果你有两个或更多轨道需要保持同步,这可能会很有用。

使用“编辑”>“拆分删除”来留下一个标记删除的间隙

图 7-6. 使用“编辑”>“拆分删除”来留下一个标记删除的间隙

现在你可以继续进行重录。不用担心录音电平与原始项目完全相同,因为使用效果>放大很容易调整。当它令人满意,没有任何嗝、颠簸或咳嗽时,复制并粘贴到间隙中(图 7-7).边缘可能不会完全匹配,但我们可以修复它。

将新片段粘贴到删除不良部分时留下的间隙中

图 7-7. 将新片段粘贴到删除不良部分时留下的间隙中

有几种方法可以处理新片段两侧的空隙。最简单的方法是删除它们。如果你不想缩短轨道,使用生成>静音来填充间隙。

另一种方法是使用时间移动工具将所有内容一起移动。当你看到对齐指南出现时,边缘将完全匹配,这是一个黄色垂直线,当边缘完美对齐时出现。点击标记边界连接的地方,然后放大直到你可以使用修复效果来平滑补丁的边缘。这个操作的最大样本大小为 128 个样本,所以放大直到你可以做出如此小的选择。缩放工具以你点击的地方为中心。然后点击效果>修复,它使用插值来创建无缝连接。

另一个有趣的 Audacity 技巧是使用效果>改变节奏来减慢补丁的速度而不改变音调。你可以通过选择选择工具栏中的“长度”单选按钮并从补丁的开始到间隙的结束进行选择来测量所需的精确长度。当你正好在边界上时,黄色的对齐指南会出现。图 7-8 中的示例需要 60 秒长。

然后只选择你的补丁,点击效果 > 更改速度,并输入新的长度,如图图 7-9 所示。点击预览按钮,如果听起来不太奇怪,点击确定,你就完成了。

确定你的补丁需要多长时间

图 7-8。确定你的补丁需要多长时间

使用效果 > 更改速度来拉伸补丁

图 7-9。使用效果 > 更改速度来拉伸补丁

降低过高峰值

你还应该寻找波形中任何不成比例的高峰(图 7-10")),然后扩大轨道的宽度(用鼠标抓住边框并拖动),直到你看到左边的分贝刻度(图 7-12)。在这个例子中,看起来声音部分可能比 12 分贝还要响亮,所以这给了我一个尝试的起点为-12。记住,Audacity 给你几乎无限的撤销(编辑 > 撤销或 ctrl-Z),所以使用试错是安全的。

从 2.7 秒到 3 秒的部分声音太大。

图 7-10。从 2.7 秒到 3 秒的部分声音太大。

轨道面板中的分贝刻度可以在编辑 > 首选项 > 界面对话框中调整,从 0 到-36 到 0 到-145。这让你可以调整显示以适应你的需要。我通常将其保持在-60,因为这给了我足够的细节,同时又不会使刻度太大。

将波形显示更改为波形(dB)

图 7-11。将波形显示更改为波形(dB)

这个选择可能比 12 分贝还要响亮。

图 7-12。这个选择可能比 12 分贝还要响亮。

淡入

有两种控制淡入和淡出的方式。简单的方法是选择您想要淡入或淡出的音轨部分,然后点击 效果 > 淡入淡出。您所做的只是控制淡入的长度。

为了更精细的控制,请使用包络工具。点击波形以创建控制节点,然后拖动这些节点以使您的音轨的不同部分更响或更轻。将节点拖过音轨边界以删除它们。

归一化

当您的音轨都修剪并清理完毕后,最后一步是应用 效果 > 归一化。确保归一化对话框中的两个框都勾选了(“移除任何直流偏移”和“归一化最大幅度”)。直流偏移指的是平均幅度;如果这不是零,则归一化将不会正确应用,因为幅度级别将不平衡,甚至可能产生一些失真。图 7-13 显示了直流偏移的示例,在纠正前后。

归一化前(上方)和归一化后(下方)的波形图

图 7-13。归一化前(上方)和归一化后(下方)的波形图

导出为 MP3 或 Ogg?

现在您的录音已经全部清理完毕,是时候将其导出为压缩有损格式了,无论是 Ogg Vorbis 还是 MP3(MPEG-1 音频层 3,不是 MPEG-3)。(参考第十三章和第十四章了解如何在 Linux 和 Windows 上启用 MP3 支持。)

MP3 是通用的便携式数字音频格式:所有设备都支持 MP3。正如我们在第一章中讨论的那样,Ogg Vorbis 和 MP3 之间存在差异。一些听众声称 Ogg Vorbis 的音质优于 MP3。在低比特率下,对我来说两者听起来都不太好;相反,它们听起来平淡无奇,缺乏特色或深度。在高比特率下,两者听起来都可以接受,尽管我认为 Ogg 提供了更准确、更自然的声音。MP3 的声音听起来有点过于明亮和刺耳。

Ogg Vorbis 支持多声道环绕,而 MP3 只支持一个或两个声道。MP3 受到多个不同国家不同专利持有者的专利限制,最后一个专利将于 2017 年到期。这意味着如果您以 MP3 格式分发您的作品,您会遭到攻击律师的拜访吗?我不知道。似乎许多艺术家将他们的作品作为 MP3 分发,而不支付版税,并且没有遇到麻烦。请咨询在这些问题上专长的律师。

即使你的听众都拥有宽带,保持节俭的态度也是一个好习惯。他们并不都有宽带;美国拨号用户的估计在 25% 到 45% 之间。别忘了互联网是国际性的,所以你的潜在观众包括依赖拨号和低速无线网络的国家。即使是宽带用户,网络拥塞和排队也会影响流媒体,所以结论是流式音频在较低比特率下仍然更可靠。

总是会有权衡。如果你的播客托管商允许,你可以为你的听众提供不同质量级别和流式传输以及可下载文件的收听选项。

Ogg Vorbis 音质设置

在 Audacity 中导出 Ogg 文件很简单。你可能已经阅读了如何操作的文章,建议使用可变比特率(vbr)而不是固定比特率(cbr)。尽管这是好建议,但这是不必要的,因为 Ogg Vorbis 不支持 cbr。选择 文件 > 导出 > 保存类型:Ogg Vorbis 文件,然后点击 选项 按钮(图 7-14

图 7-14. 设置 Ogg Vorbis 音质等级

变比特率意味着简单段落将具有较低的比特率,而更复杂的段落将具有较高的比特率。这比固定比特率提供了更好的质量。你将无法精确计算文件大小,但发明 Ogg Vorbis 的那些人并不认为通过比特率来衡量质量很重要。为了提供一个比较的基础,3 的质量设置会导致平均比特率约为 112Kbps,而 Ogg 粉丝声称它比 128Kbps 的 MP3 声音更好。

Ogg Vorbis 使用最高到 5 级的 有损通道耦合。左右通道之间的冗余被组合起来以节省空间。这可能会影响立体声图像,所以如果你觉得这很烦人,可以使用 6 或更高的质量设置,因为在这个级别通道耦合被关闭。我使用 6。我的耳朵无法分辨 7 及以上之间的区别。当然,你的耳朵可能会告诉你不同的故事。

对于简单的语音播客,你可以一直降到 0,它仍然听起来可以接受。

MP3 音质设置

在 Linux 和 Windows 上,你可能需要单独安装 MP3 编码器。使用 LAME MP3 编码器,因为它质量高、免费且开源。Linux 用户可以从他们的常规软件仓库安装它,而 Windows 用户应遵循 Audacity 下载页面上的说明(audacity.sourceforge.net/help/faq?s=install&item=lame-mp3)。

注意

Windows 用户应访问 OSSwin 项目(osswin.sourceforge.net/)以找到数百个优秀的 Windows 开源应用程序链接。

我不知道音频爱好者是否喜欢为了争论而争论,或者他们只是对一切事物都有强烈的激情,因为 MP3 质量设置是争议的雷区。只需遵循这个简单的规则,你就会没事:我是你的作者,我是对的(除非你的耳朵告诉你不同)。

在 Audacity 中,你可以设置 MP3 比特率的四个类别:预设、可变、平均和恒定。

预设为你提供了 LAME 开发者推荐的四种不同的预制组合:中等、标准、极限和疯狂。标准适合音乐,但你可以降低比特率以进行简单的语音播客。中等、标准和极限都使用可变比特率(vbr)。可变比特率意味着比特率根据声音的复杂度而变化,这导致更好的音频质量。在旧时代,可变比特率给 MP3 播放器带来了麻烦,因为它们是为恒定比特率(cbr)设计的。但那已经是很久以前的事情了,如今可变比特率不应该带来任何问题。可变比特率总是在一个范围内定义,例如标准预设的 170Kbps 到 210Kbps。

疯狂使用最大的恒定比特率,320Kbps。根据我的经验,标准设置(170Kbps 到 210Kbps)大约是 MP3 可以提供的最佳效果,超过这个范围并不会带来明显的差异。

可变比特率有 10 个质量设置。质量设置 5 是 110Kbps 到 150Kbps,这对于简单的语音播客来说足够了。

平均在我看来,不值得费心。它是可变和恒定比特率之间的折衷。你设置一个恒定比特率,但由于它是平均的,允许有一点波动。所以质量并不完全像可变比特率那样好,但比恒定比特率略好。

恒定比特率应该更适合在互联网上流式传输音频,并且你可以得到一个可预测的文件大小。如果你想要使用恒定比特率,Audacity 为你提供了全范围的选项。

设置可变速度:标准。标准提供更好的质量,编码需要稍微长一点时间。

图 7-15 和图 7-16 显示了 MP3 导出菜单和各种质量设置。

留存通道模式:立体声,因为你必须非常渴望存储空间才会考虑使用联合立体声。如果你非常渴望存储空间,以至于你考虑以 112Kbps 或更低的比特率编码你的 MP3 文件,那么可以尝试一下。联合立体声这个术语是一个糟糕的名称,并不能描述它所做的事情。一个普遍的误解是它将两个立体声通道合并并破坏了立体声分离。像音频工程中经常发生的那样,这比那要复杂得多。这里有一个新的音频术语给你:人类心理声学。这不是一个疯狂的人拿着大刀的意思,抱歉。它的意思是按照人类耳朵感知声音的方式来处理音频,而不是严格遵循一个数学模型,这个模型并不符合人类听力的实际工作方式。这相当复杂,如果你不喜欢联合立体声的声音,很容易就可以重新做。

Audacity 支持广泛的 MP3 比特率。

图 7-15. Audacity 支持广泛的 MP3 比特率。

Audacity 提供一系列 MP3 质量设置和预设。

图 7-16. Audacity 提供一系列 MP3 质量设置和预设。

联合立体声是什么?在 MPEG-1 音频层 3 标准中,这意味着使用几种技术中的任何一种来降低比特率,同时通过合并左右通道中的冗余来保持可接受的质量水平。这些“冗余”是人类感知为不那么方向性的频率,即高频。这应该会改善低比特率录音的声音,因为牺牲了立体声图像以保留更多的音频数据。

MP3s, 编码器和其他音频格式

LAME 代表“LAME Ain’t an MP3 Encoder”(LAME 不是一个 MP3 编码器)。在其早期,它不是一个编码器;它是一组针对原始 ISO/IEC 演示源代码的补丁,因此(非常严格地)从技术上讲,它不是一个编码器。随着时间的推移,LAME 开发者编写了所有新的代码,直到 LAME 不再需要 ISO 源代码,现在它显然是一个编码器。由于 MP3(MPEG-1 音频层 3)格式周围的专利问题很复杂,已经开发出几种替代格式:Vorbis(开源)、高级音频编码(AAC)和 Windows 媒体音频(WMA)。AAC 和 WMA 都有自己的问题,稍后将会讨论。

没有 MP3 专利持有者曾经追责开源编码器的开发者或个人使用 MP3 进行私人用途。

其他有损格式

还有其他一些有损压缩的音频格式,可以生成小文件大小,如 AAC、WMA 和 RealPlayer。Audacity 通过 Linux 和 Windows 上的 FFmpeg 库支持这些格式,并有一些不错的导出预设。你也可以使用你选择的任何外部编码器,你可以在导出对话框中的“另存为类型”下拉菜单中访问它(图 7-17)。

使用“外部程序”选项使用任何已安装的音频编码器导出。

图 7-17. 使用“外部程序”选项使用任何已安装的音频编码器导出。

注意

请参阅第十三章和第十四章了解如何安装 FFmpeg 和 MP3。

AAC 最初并不受欢迎,直到苹果将其选为 iTunes Store 及其所有音频设备的默认格式。WMA 是 Windows 媒体格式,而 RealPlayer 则是 . . . 好吧,就是 RealPlayer。AAC、WMA 和 RealPlayer 都是封闭的、专有格式,它们带有各种令人不快的特性,如数字版权管理(DRM)、跟踪软件和专利垃圾。

导出您的播客

一旦你决定将播客导出为哪种格式或哪些格式,请选择文件 > 导出以进行实际导出。你可以从同一个 Audacity 项目中导出各种类型的文件。请注意,你可以通过选择一部分并然后选择文件 > 导出选择来导出轨道的一部分。

双人播客

假设你不想成为一个孤独的宣讲隐士,而是想有一个合著者或者想采访另一个人。最简单、最好的方法是每个人都有自己的单声道麦克风,连接到单独的录音通道。这使得编辑和修复变得容易得多。对你的听众要友好,并尽量使两个声音的音量尽可能接近。让你的耳朵成为你的指南,而不是波形,因为即使波形显示两个声音的音量相等,有些人听起来声音更大。(又是那个心理声学的小玩意儿。)

如果你使用的是带有真实立体声麦克风端口的上网本或笔记本电脑,你可以使用一个分线器来插入两个单声道麦克风。

将双轨录音作为单声道立体声轨道编辑

当你录制两个通道时,无论你如何设置,Audacity 都会创建一个单声道立体声轨道。图 7-18 显示了这是如何看起来。[注意波形如何表明每个人都有礼貌地轮流发言。]

使用两个单声道麦克风,一个左一个右,在单个 Audacity 立体声轨道中录音

图 7-18. 使用两个单声道麦克风,一个左一个右,在单个 Audacity 立体声轨道中录音

您可以通过使用全新的混音板来调整左右通道的相对音量,这是 Audacity 1.3.8 版本首次出现(图 7-19)。使用混音板调整轨道的增益或音量级别,并使用平衡滑块调整左右通道的相对音量。这些调整不会改变项目文件;您将在 Audacity 的播放和最终导出中听到变化,但您的 Audacity 项目文件将不会被修改。混音板控件是全有或全无;它们适用于整个轨道,不能仅应用于轨道的某些部分。

混音板

图 7-19. 混音板

这相当简单,如果您想要更多控制,可以将您的录音拆分为两个单声道轨道。

将双轨道录音作为两个单声道轨道编辑

将您的立体声轨道拆分为两个单声道轨道可以给您带来更多的控制。在轨道菜单中点击下拉箭头,选择拆分立体声轨道(图 7-20)。现在您有两个独立的轨道,可以对每个轨道进行所需的任何更改和修复。

将立体声轨道拆分为两个单声道轨道以便于编辑。

图 7-20. 将立体声轨道拆分为两个单声道轨道以便于编辑。

您应该给每个轨道命名(也可以通过使用轨道菜单),这样您就可以始终知道它们是什么。

注意

这里有一个关于混音板的技巧:如果您在轨道名称中使用某些词,如guitarvocalspiano以及一些缩写,图标将与名称匹配。参见自定义混音板以查看关键词的完整列表。

在将立体声轨道拆分为两个单声道轨道后,分别编辑每个轨道,进行常规修复并尽可能匹配两个扬声器的音量。默认情况下,当您按下播放键时,Audacity 会同时播放所有轨道。在混音板上寻找静音和独奏按钮来控制您想要听到的轨道。独奏会自动静音除您想要听到的轨道之外的所有轨道;静音会逐个静音轨道。

如果你们两个人同时说话,你可以通过添加静音来将他们分开。例如,如果他们同时说话有五秒钟的重叠,你可以在一个音轨上添加五秒钟的静音来将他们分开。将光标定位到你想要静音开始的地方,点击生成 > 静音,并输入你想要的静音秒数。你可能需要在两个音轨上多次这样做以保持它们对齐,尤其是在做出更改后。

当你清理完一切并准备好导出时,使用上方的音轨菜单重新组合你的音轨,点击制作立体声音轨

添加背景音乐音轨

现在你已经精通制作多轨播客,添加音乐音轨就像跌倒一样简单。就像你制作个人播客时一样,即使它是单声道录音,你的音轨也应该是双声道立体声音轨。这样你的听众就会在两个通道中听到音乐。你可以通过复制音轨,将其粘贴在原始音轨下方,并从上方的音轨菜单中选择制作立体声音轨来从单声道音轨创建双声道音轨。

你可以通过打开文件 > 导入 > 音频对话框或将内容从另一个 Audacity 项目复制粘贴过来,将音乐文件添加到你的播客项目中。

你可以使用增益滑块调整音乐音量。记住,增益滑块不会改变你的项目文件,所以这是一个快速调整混音而不需要做出可能破坏未来编辑的项目的大量更改的方法。另一个选项是使用包络工具来调整它,从愉悦的背景到令人激动的渐强。包络工具会改变项目文件。

管理背景音乐音轨的音量还有一种更酷的方法,那就是使用效果 > 自动降低音量。这对于带有背景音乐音轨的录音来说非常完美,因为它会在前景音轨切入时自动降低音量,在前景音轨切出时提高音量。在图 7-21 中我们看到设置:背景音乐音轨在上方,下方音轨是语音音轨。当语音开始时,我希望音乐音量降低,当语音停止时,音乐应该变得更响。音轨的顺序必须是:背景音轨在上方,前景或控制音轨在下方。

使用自动降低音量,你的背景音轨必须在上方,前景或控制音轨在下方。

图 7-21. 使用自动降低音量,你的背景音轨必须在上方,前景或控制音轨在下方。

选择背景音轨,然后点击效果 > 自动鸭音。您将看到一个控制面板,类似于图 7-22 中的面板,它显示了我想使用的设置。这些设置创建了一个快速淡出和缓慢淡入的效果。背景音轨快速退出,然后优雅地以微小的重叠与声音音轨缓慢滑回。

为快速淡出和缓慢淡入推荐的自动鸭音设置

图 7-22. 为快速淡出和缓慢淡入推荐的自动鸭音设置

图 7-23 显示了结果。

已应用自动鸭音;将其与图中的音轨进行比较。

图 7-23. 已应用自动鸭音;将其与图 7-21 中的音轨进行比较。

鸭音量决定了背景音轨的音量减少量。

最大暂停时间决定了总的淡入和淡出将花费多长时间。外部淡出长度和外部淡入长度的值总和不能超过最大暂停时间。

外部淡出长度设置决定了背景音轨在控制音轨上的声音回来之前会多快地淡出。两条垂直线之外发生的事情是在控制音轨低于阈值时发生的。内部淡出长度设置决定了与控制音轨的重叠程度。

外部淡入长度设置设置当控制音轨上的声音停止时,背景音轨淡回的速度,内部淡入长度设置控制重叠。在声音上轻轻上升半秒的音乐并不多;我认为这使过渡听起来很棒。

阈值设置控制触发自动鸭音效果的音量水平。

当您完成时,您需要将音轨混合并渲染成一个单独的立体声音轨。如果您按下 ctrl-shift-M,这将把您的项目混合成位于原始音轨下方的新的立体声音轨。这是我首选的混音方式,因为它保留了原始音轨,然后我将新的立体声音轨复制到一个新的 Audacity 项目中,进行最后的调整和导出。如果您使用轨道 > 混合和渲染,则原始音轨将被新的立体声音轨替换。

有时候,合并多个音轨会使它们声音太大,所以撤销混合和渲染(ctrl-Z 或编辑 > 撤销),然后使用增益控件将它们降低一点。然后再次导出。(当您遇到音轨音量问题时,例如不平衡的声音,请检查您的增益滑块。)

现在您的带有背景音乐轨道的播客已经准备好导出了。

访问第十一章了解 Audacity 特殊效果的相关信息,第十二章获取修复和清理的技巧,以及第九章学习更多关于多轨录音和混音的知识。

第八章。成为网络明星

无标题图片

您想分发自己的录音,甚至可能通过销售它们来赚钱。在这个美好的互联网时代,在线分发既容易又便宜。在在线音乐分发中取得成功需要两种不同的技能:在多种格式下创建优质录音的技术能力,以及理解作为专业艺术家的业务,这很复杂,包括客户服务、合同和版权问题。在本章的第一部分,我们将学习创建不同音频文件格式,用于各种目的,如低质量的促销 MP3、流媒体音频和高质量下载。在第二部分,我们将探讨作为录音艺术家的业务,这比成为一名优秀的音乐家和录音专家更具挑战性。

文件格式和音频质量

使用 Audacity,您可以轻松地将音频文件导出为任何您想要的格式。让我们看看您的选项。常见的可下载格式包括 AAC、MP3、Ogg Vorbis、WAV 和 FLAC。

注意

如果您需要复习如何导出不同的音频文件格式,请查看第一章,并查看第十三章和第十四章了解如何设置和调整系统以进行音频制作。

AAC 越来越受欢迎,因为这是苹果 iTunes Store 使用的格式。Audacity 的 1.3.6 版本引入了对通过 FFmpeg 导入、导出和转换非 DRM AAC 文件的支持。这些文件具有 M4A(A代表音频)文件扩展名。M4P 文件是受 DRM 保护的。(不,它不是P代表糟糕,而是受保护。)

在 Audacity 中创建 AAC 格式的文件很简单:选择文件 > 导出 > 保存类型:M4A (AAC) 文件(FFmpeg)并点击选项按钮。在选项对话框中,您有一系列从 10 到 500 的质量设置,其中 500 是最高质量。这个范围代表公平、不错、好、更好和最佳。256 设置适合更复杂的录音。非常简单的录音,如单声道的口语作品,在 50(图 8-1)时听起来还不错。

导出到 AAC 格式(默认 iTunes 格式)创建一个以.m4a 扩展名的文件。

图 8-1。导出到 AAC 格式(默认 iTunes 格式)会创建一个以.m4a 扩展名的文件。

Audacity 支持许多不同的 MP3 选项,你可以在第七章中了解所有这些选项。让我们回顾一下最实用的那些。MP3 支持恒定比特率和可变比特率。可变比特率提供更好的音质。你的在线分发网站将会有特定的要求,而使用 Audacity,你可以轻松调整你的音乐以满足这些要求。

128Kbps 的恒定比特率 MP3 在美国是最基本的共同标准。这将在每个数字音频播放器上播放,并且一些分发商要求使用恒定比特率的 MP3 进行流媒体播放。在 Audacity 中,点击文件 > 导出 > MP3 文件 > 选项 > 恒定 > 128Kbits/sec。选项对话框为你提供了从 8Kbps 到 320Kbps 的广泛恒定比特率。尽管 320Kbps 经常被吹捧为 CD 音质,但实际上并非如此。你自己的耳朵可能会告诉你不同,但我在 192Kbps 以上没有听到任何改进。

注意

一些低带宽运营商可能需要低至 32Kbps 的比特率来流式传输互联网音频。虽然这听起来可能并不美妙,但它扩大了你的潜在受众。美国一半的互联网用户仍在使用拨号上网,许多其他国家仍然主要依赖低带宽互联网服务。

对于可变比特率 MP3,你最佳的 Audacity 选项是在文件 > 导出 > MP3 文件 > 选项 > 可变对话框中。选择你希望的质量设置,设置变量速度:标准,通道模式:立体声(图 8-2).此菜单中有 10 个比特率选项,从 45Kbps 到 85Kbps 到 220Kbps 到 260Kbps。我喜欢 170Kbps 到 210Kbps 作为音乐的合适水平,我喜欢 110Kbps 到 150Kbps 用于简单的口语作品。变量速度选项将可变比特率限制在一定的范围内,这样你可以获得更好的音质和一定的可预测性。

在 Audacity 中使用 MP3 的可变比特率设置

图 8-2。在 Audacity 中使用 MP3 的可变比特率设置

如果你的发行商支持,你还应该为不介意 MP3 的用户提供 Ogg Vorbis 文件。他们可能更喜欢 Ogg 的高质量,或者他们可能更喜欢使用开源、不受专利限制的格式。Ogg Vorbis 可以像 MP3 一样进行流媒体播放或下载。它以低比特率提供高质量,并支持多声道环绕,而 MP3 只支持一到两个声道。MP3 是一个封闭的、专有的标准,充满了混乱、令人困惑的专利冲突。我还没有听说过任何专利持有者起诉使用开源编码器(如 LAME)的人,LAME 是 Audacity 使用的首选 MP3 编码器,而且我也没有听说过任何小规模用户因为以 MP3 格式分发他们的作品而遇到麻烦。只是要注意,这可能是你一些粉丝的问题,而且有可能变成你的问题。

Audacity 支持 Ogg Vorbis,并且很容易选择你的质量级别。转到 文件 > 导出 > Ogg Vorbis 文件 > 选项。你将看到一个带有小滑块的菜单,让你从 0 到 10 的 11 个质量设置中进行选择。3 的值大约相当于 128Kbps 的 MP3。5 的值对于音乐来说相当不错,但有一个可能的缺点:Ogg Vorbis 在 5 级别及以下使用通道耦合。这意味着两个立体声通道之间的冗余被组合起来以节省带宽,因此你可能会注意到立体声图像的损失。6 级别及以上不使用通道耦合。我并没有感觉到超过 7 级别有任何增益,尽管你的耳朵可能会告诉你不同。Ogg Vorbis 的支持正在快速增长,许多播放设备都支持它(图 8-3)。

导出为 Ogg Vorbis 格式

图 8-3. 导出为 Ogg Vorbis 格式

FLAC 是一种出色的无损压缩格式,它以较小的文件大小提供 WAV 音质。FLAC 文件通常比 WAV 文件小三分之一。对于在电脑上播放音乐或拥有基于电脑的音乐服务器的粉丝来说,FLAC 是非常好的选择,而且越来越多的家用和便携式音乐播放器支持 FLAC。FLAC 不能进行流媒体播放,但必须下载后才能播放。

FLAC 支持双声道和立体声。

图 8-4. FLAC 支持双声道和立体声。

FLAC 支持 16 位和 24 位深度,并提供 9 个压缩级别,从 0 到 8 (图 8-4)。默认值为 5,这是一个很好的选择,尽管没有人会因为尝试其他选项而责怪你。不同的设置代表不同的压缩级别,其中 0 为最小压缩,8 为最大压缩。FLAC 是无损压缩,因此质量上没有区别,只是文件压缩的大小不同。8 的值编码时间比 5 长几倍,但额外的好处并不多。对最大压缩的 FLAC 文件进行解码所需的时间并不比轻度压缩的文件长,因此压缩程度不会影响播放。

WAV 是高质量未压缩音频的标准。文件大小很大,不能流式传输,但对于想要将文件轻松转换为其他格式(如 CD 和低质量便携式格式)的粉丝来说非常棒。当然,也可以单独欣赏。转到文件 > 导出 > 其他未压缩文件 > 选项。在未压缩导出设置对话框(图 8-5)中,选择标题:WAV(微软),然后选择你的编码。选择已签名的 16 位 PCM 或已签名的 24 位 PCM。16 位是 CD 质量,24 位是 DVD 和录音室母带质量。仅当你的原始录音是 24 位或更高时才选择 24 位。

WAV 设置应该是已签名的 16 位或 24 位。

图 8-5. WAV 设置应该是已签名的 16 位或 24 位。

已签名表示正整数,这是我们第一章中学到的。你想要 16 位或 24 位的已签名整数,因为那些是 Audacity 之外可播放的格式。32 位浮点数是 Audacity 和其他音频编辑器内部使用的中间编辑格式。

录音艺术家的业务

你开始认真考虑分发自己的录音。你听说过艺术家被娱乐行业欺骗的恐怖故事,并且记住了柯特妮·洛夫(Courtney Love)在 2000 年 5 月 16 日数字好莱坞在线娱乐会议上的精彩演讲,“柯特妮·洛夫的数学”(salon.com/technology/feature/2000/06/14/love/):

今天我想谈谈盗版和音乐。什么是盗版?盗版是指未经支付意图窃取艺术家作品的行为。我说的不是 Napster 类型的软件。

我说的是大型唱片公司的录音合同。

弗兰克·扎帕(Frank Zappa)和简尼斯·伊恩(Janis Ian)也写过或发表过类似的作品,你应该能在网上找到。

或者,你可能并不担心与大型唱片公司签约可能带来的不愉快体验,但你希望保留对自己命运和作品的掌控权。你希望发布符合你规格的录音,并针对不同的用途进行定制,而不是将一切简化为最低的共同点。你希望在你想工作的时间和地点工作,而不是让别人告诉你该做什么。当有人真的想购买你的作品时,你希望尽可能简化这个过程,并保留这笔钱。那么,你该怎么做呢?

我无法帮助你获得名声、荣耀和粉丝团。引起注意仍然是最难的部分。但我可以为你指明在线分发资源的途径,并告诉你如何为不同的用途打包你的录音,例如高品质的音响爱好者、低音质的促销 MP3、流媒体音频和 CD。

建立在线存在感

分发和推广曾经是录音艺术家面临的大障碍,这也是他们为什么需要与唱片公司达成协议的原因。现在,由于互联网,分发变得容易。互联网分发策略有两个部分:你自己的个人网站和尽可能多的音乐分发和广播网站。始终拥有自己的个人网站,上面有照片、联系方式以及粉丝可以听和购买你音乐的链接。这增加了你的搜索引擎存在感,并使粉丝更容易找到你。请务必抵制制作一个典型的过度制作的网站,里面充满了特殊效果和动画,以及深色、几乎无法阅读的色彩方案;这保证你会赶走你的访客。让它保持干净、简单、易读,并且易于导航,因为没有人关心你的网页设计师有多自恋。他们想了解你和你如何听你的音乐,他们不希望为了到达那里而跳过任何障碍。

你应该有一个一致的在线身份。建立你的在线身份的第一步是注册你自己的域名。不要使用推广他人业务的电子邮件地址或域名,比如 carlarockstar@gmail.com 或 guitarcarla@hotmail.com。免费电子邮件地址本身就非常不酷。域名很便宜,大约每年 15 美元。如果你更换网络托管商和电子邮件服务提供商,你的域名将始终与你同行。假设你有一个乐队——比如说你是 The Bandits——你的域名是 thebandits.com/。现在你可以用域名做各种创意事情。你乐队的每个人都可以有自己的电子邮件地址,比如 drummer@thebandits.com、diva@thebandits.com 或 rockgod@thebandits.com。无论你尝试什么音乐发行商、托管服务或社交网站,thebandits.com/ 总会为你的粉丝提供一个找到你的地方。

有各种各样的域名注册商,如 Dotster、GoDaddy、Register.com、Tucows 等等。大多数网络托管服务也包括域名注册,但我建议将两者分开。网络托管是一个充满短期行为的残酷行业,这些公司来来去去,一个糟糕的注册商可能会让你难以转移到另一个注册商,甚至可能失去你的域名。互联网名称与数字地址分配机构(ICANN)负责域名,并维护一个认证注册商的名单(www.icann.org/en/registrars/accredited-list.html)。这并不保证他们的客户服务或价格有多好,只是说明他们是合法的注册商。WebHostingTalk (www.webhostingtalk.com/) 是关于托管服务和注册商的实战信息的好来源。

仔细考虑你想要在网站上放置哪种联系方式,因为得益于互联网的神奇力量,沟通可能会变成一个深度的耗时陷阱。如果你不想花大量时间回复电子邮件、推文、论坛帖子等等,那么就限制人们如何联系你。一个由验证码保护的网页表单是允许粉丝与你交流而不被垃圾邮件淹没的好方法。使用简单的算术问题或多项选择题(“如果你是人类,点击小狗的图片。”)的验证码既简单又有效。那些模糊文本的验证码令人烦恼,对除了垃圾邮件发送者之外的所有人来说都很难。

哪种网站设计师是好的?是那种愿意倾听你意见的人;能够用通俗易懂的语言(或你选择的任何语言)解释他们所做的工作;并且更倾向于简洁、快速、易于导航的网站设计,而不是那些追逐粉丝的华丽展示。始终在拨号连接和智能手机上测试你的网站。宽带并非无处不在,移动互联网的使用正在爆炸式增长,所以你需要关注你的网站在慢速连接和微小屏幕上的外观和性能。

备注

记得也要考虑到视力受损粉丝的易用性。美国人口老龄化,所以欢迎所有粉丝是好的商业行为,易用设计对所有访客都是好的设计。如果你的网站设计师不愿意让网站对所有访客友好,那就找另一位设计师吧。

考虑租用一个蜗牛邮箱。它是可靠的,可以过滤掉那些随意的意识流 Twitter/电子邮件通讯,并确保任何真正想和你交谈的人都能这样做。

那么,MySpace 和 Facebook 呢?去尝试吧;它们是免费的,你可能会对在那里找到你的人感到惊喜。留出一些时间来保持它们最新。你不必每天登录就能与粉丝进行深入、有意义的对话,但一定要确保所有关于你的录音和表演的链接和信息都是最新的。建立追随者需要时间,所以要有耐心,阅读所有告诉你如何从 MySpace 和 Facebook 中获得最大利益的实用信息。没有快速、神奇的解决方案,你不应该相信那些试图向你推销的人。

千万不要发送垃圾邮件。不要相信那些声称他们出售真实可靠的自愿订阅邮件列表的“营销人员”,这些人声称列表里都是愿意收到你消息的人。这是谎言。你应该仔细构建自己的邮件列表。正确的方式是进行确认订阅,这意味着当有人注册时,他们必须回复一封发送以确认他们注册的电子邮件。让退订比注册更容易;营销人员和垃圾邮件发送者不愿学习的一个教训是,你不能强迫人们喜欢你。

一定要小心——网上没有隐私。你说的每一句话都是公开表演,永远被记录下来。

你必须衡量自己对发短信、Twitter 以及任何其他新潮通讯工具的容忍度。它们可能强大而有效,也可能让你发疯。

在线音乐发行商

与一个处理销售、给你公平分成且不试图侵犯你版权的独立在线音乐商店合作,这不再是幻想,你有很多选择。以下是一些采用不同方法分发音乐和补偿艺术家的网站的样本。

Magnatune 的(www.magnatune.com/)座右铭是“我们不是邪恶的”。他们还有另一个我更喜欢座右铭:“你得到优秀的音乐,音乐家得到 50%。”这是销售收入的 50%,而不是利润。Magnatune 以几种无 DRM 格式分发音乐:仅流媒体播放,类似于收听广播,各种格式的下载,CD,以及商业用途的许可证。所有音乐都是先试后买,客户可以选择他们想要听的歌曲和专辑,或者收听各种流媒体。Magnatune 客户还可以每月支付 15 美元获得流媒体会员资格,这可以购买无广告的无限制收听和下载。

Magnatune 支持 MP3、WAV、FLAC、AAC 和 Ogg Vorbis 格式。WAV 和 FLAC 是最高质量,WAV 可以写入 CD。128Kbps 的 MP3 是最低质量,并受 Creative Commons“署名-非商业性使用-相同方式共享”许可协议的约束。这为非商业用途提供了宽松的权利:分享、混音、采样和翻唱。任何商业用途都预期需要付费。Magnatune 网站上有很多信息,并且他们有真人可以交谈。

您对自己的作品保留所有版权,并且可以与其他发行商达成协议。只要艺术家们每六个月至少赚取 100 美元,Magnatune 就会支付他们报酬。

CD Baby (www.cdbaby.com/)销售无 DRM 的 CD 和 MP3 下载,并与 iTunes 和 Amazon 等众多在线商店合作。它还提供大量 CD 复制和艺术作品制作。CD Baby 每张专辑收取 35 美元的设置费;这包括 CD 数字化、将曲目转换为各种格式、扫描封面艺术,以及进行其他家务杂事。您自行设定 CD 定价。CD Baby 每张光盘收取 4 美元,并保留下载销售的 25%。艺术家们每周获得报酬。您的 CD 将通过众多商店如 Borders 和 Amazon 提供。

CD Baby 为现场演出提供一项优质服务——其信用卡刷卡计划。这是一个您可以将它带到现场并在您的商品桌上设置的信用卡/借记卡终端。CD Baby 从中抽取 12.8%的提成。这听起来很多,但拥有自己的商户信用卡账户是昂贵的。无论您是否卖出任何东西,您都需要支付每月费用,以及每笔销售的百分比,通常每笔刷卡交易约为 2.5%到 3%。如果您在商品桌上销售 CD,CD Baby 将收取 12.8%的提成,而不是通常的 4 美元。

CD Baby 为艺术家提供多项其他服务,如 Host Baby(网站托管)、贴纸和卡片,以及预订服务。

eMusic (www.emusic.com/) 是一家备受推崇的无 DRM MP3 在线音乐商店,拥有众多优秀的独立乐队和主流流行音乐。然而,他们并不接受任何人;他们与已建立的音乐厂牌合作,因此您需要已经与某人签约。eMusic 完全是企业化和法律化的,充满了官僚主义。尽管如此,它可能对音乐爱好者来说比不知名的音乐家更有利,尽管探索一下也无妨。

TuneCore (www.tunecore.com/) 采用统一费率制度。每首歌收费 9.99 美元,外加 9.99 美元的年度维护费,或者第一年每张专辑收费 49.99 美元,之后每年 19.98 美元,再加上 19.98 美元的年度维护费。这使您能够进入包括 Amazon MP3、eMusic、Rhapsody 和 Spotify 在内的 19 家在线商店。他们还提供 Amazon: Disc On Demand 选项,用于销售 CD。大多数商店的销售报告有两个月的时间滞后,而 TuneCore 每月报告两次。之后,您可以随时提取您的资金。(需要 PayPal 账户。)

iTunes (www.apple.com/itunes/content-providers/faq.html) 是一个大型的平台。需要跳过许多繁琐的程序,但无风险则无收获。CD Baby、TuneCore 和 SongCast 都与 iTunes 合作,这比直接申请 iTunes 要容易。

独立在线发行联盟(The Independent Online Distribution Alliance,简称 IODA)(www.iodalliance.com/) 作为集体代理商和聚合器,利用集体谈判的力量,为独立艺术家提供一个更强的商业声音。作为回报,它从艺术家版税中提取一定比例,处理费率谈判、报告、作品分发、版税分发以及其他一些必要但繁琐的商业事务。

独立在线发行是一个不断增长的业务,您可以找到许多更多的发行网站。推广工作由您自己负责,尽管每个网站都提供有用的工具和建议来帮助您。不要成为典型的无知的艺术家,放弃您的生活或者与一些欺诈艺术家勾结。研究发行商就像坐在您的电脑前做一些网络搜索一样简单。不要忘记复杂的税务问题和仔细阅读细则。您何时会收到付款?您如何验证销售和付款记录?版权、DRM、关闭账户、进行更改、从真人那里获得帮助以及争议解决都是需要考虑的重要事项。

考虑按流派而不是按流行度选择发行商。当然,iTunes 和 Amazon 是大型企业,但如果您的领域是复杂的爵士乐、舞曲、世界音乐或其他类似类型,寻找专注于您这种音乐类型的发行商。

保持专业、商业化的态度是好的,并记住一些琐碎的细节,比如遵守诺言;联系方式;正确的拼写、语法和标点符号;可读的字体;以及美观的图形。没有人关心你在艺术上付出了多少努力。

自托管

另一个选择是自托管,这意味着运行你自己的服务器。这些现代时代与古老的公告板服务(BBS)时代不同,那时数千人从他们的卧室中的个人电脑上运行自己的 BBS 服务器。维护网站、托管自己的下载和提供你工作的流都是 DIY 爱好者的可行选择,但这对胆小鬼或技术恐惧者来说不是一件容易的事情。带宽是最大的问题:如果你想在你的家中托管服务器,首先找出你是否能以合理的价格获得足够的带宽,以及你的互联网服务提供商是否甚至允许你运行服务器。然后你将负责自己的安全、软件、硬件和系统及网络管理。成为自己服务器的老板是令人满意的,但这确实需要很多技能。

一个更好的选择是使用一个提供所有所需工具并给你带宽优惠的良好托管服务。在带宽成本上很难击败一个好的托管服务,因为它们批量购买并分摊给许多客户。然后托管服务处理硬件问题、互联网连接、安全和备用电源。计划从免费的基本低流量网站到价格合理的共享托管(这意味着一个服务器有限的互联网带宽为许多客户服务)到支付你自己的专用、不共享的服务器。你可以以低成本开始,随着你的成功逐渐升级。

注意

记住 WebHosting Talk(www.webhostingtalk.com/),以了解哪些托管商是好的,哪些应该避免。

免费开源软件世界有你需要运行自己的网站的一切。使用 Linux 操作系统,因为它强大且安全。然后有大量的优秀服务器可供选择:

  • Drupal、Joomla、Mambo 和 Plone 都是优秀的开源内容管理系统(CMS)的例子。这些是你要放在你网站上的内容的框架,这样你可以轻松组织和发布文章、照片、日历、新闻、论坛和链接。

  • Icecast 和 Campcaster 是优秀的开源流媒体 Ogg Vorbis 和 MP3 服务器,你可以将它们嵌入到你的网站上。

  • Shoutcast 是一个封闭的、专有的流媒体服务器,Shoutcast Radio 是一个快速免费的互联网广播服务,用于托管你的流。你还可以在其他网站上嵌入 Shoutcast 流。

许多网络托管服务提供 Icecast 和 Shoutcast 流媒体服务,当然还有许多其他流媒体服务器。任何托管服务都提供大量服务器软件和用于所有内容的精美图形控制面板。如果他们没有特定的软件,询问他们是否会安装它,如果软件是免费的开源软件,他们可能会安装。大多数托管服务都严重依赖开源软件,因为它免费或价格低廉,而且质量好。

在线销售商品

在线销售商品可能只需要一个网站和一个用于接受支付的 PayPal 账户,或者一个用于接收支票和汇票的邮寄地址。支票和汇票欺诈猖獗到可能不值得接受任何一种程度。PayPal 简单且受欢迎;只是确保你了解其费用结构,以免在它以无数方式蚕食你的钱时感到惊讶。Google Checkout 的费率比 PayPal 低,并且没有 PayPal 在争议解决不一致、不公平方面的声誉。你可以使用两者,这将吸引更多客户,因为许多客户在已经拥有另一个账户的情况下不会想要注册一个。

处理在线信用卡支付需要复杂的基础设施。你不想成为那些当某个青少年黑入你的客户数据库并窃取所有信息时成为头条新闻的商店之一。考虑使用已经具备所有支付处理功能的预制店面。从 Amazon.com 开始(www.amazonservices.com/content/sell-on-amazon.htm);它信誉良好,可靠,并公布其所有价格和政策,因此是研究和比较的好起点。亚马逊不直接销售独立音乐,但与 CD Baby 和 TuneCore 等音乐发行商合作。拥有一个亚马逊店面可能是一个很好的销售乐队周边产品的场所,并获得更多曝光度以及生成 CD 订单的另一种方式。

你可以通过只在个人网站上托管免费下载和流媒体,然后链接到 CD Baby、Songcast 或你合作的任何发行商,来避免支付问题。

几乎每个人都忘记的一件事是客户服务。当客户有问题或需要帮助时,他们如何联系你,电话?电子邮件?谁会回应,你能否指望他们快速回应并以保持客户满意的方式回应?如果你销售像 CD、DVD、T 恤和其他品牌商品这样的实体物品,谁会打包和发货,以及速度如何?客户服务是至关重要的。无论你的艺术天才多么伟大,获取新客户的花费至少是保持现有客户满意的十倍。

是否使用数字版权管理(DRM)?

数字版权管理(DRM),或者有些人更喜欢称之为数字限制管理,意味着复制保护,以及各种旨在防止非法复制的科技。这个概念听起来不错,因为人们免费复制你的音乐听起来就像是一种欺诈。但在实践中,它是一场噩梦。它甚至无法减缓那些复制和销售数千张电影和音乐 CD 的大规模盗版者。它无法阻止那些想要免费东西的聪明孩子。它主要阻碍了合法付费的客户。

这给在线分发增加了无法容忍的额外负担,因为这需要始终可用的认证服务器。就在几年后,这已经开始崩溃。沃尔玛在 2008 年 9 月宣布将关闭其 DRM 认证服务器,这意味着如果客户试图将他们购买的 DRM“受保护”的音乐转移到另一台机器或从系统故障中恢复,他们将无法播放这些音乐。沃尔玛的补救措施是让客户将他们的 DRM“受保护”曲目复制到 CD 上,这样就可以在任何地方播放。对此的强烈抗议导致他们改变了计划,并继续维护他们的 DRM 服务器。尽管他们已经转向无 DRM 的分发,但那些旧的 DRM 负担还将长期困扰他们。

苹果的 iTunes 商店在 2008 年 2 月去除了 DRM,现有的 DRM 保护文件可以以每首歌 30 美分或专辑价格的 30%转换为无 DRM 版本。(感谢你们给我两次付费的机会。)雅虎和 Rhapsody 也已经远离了 DRM。亚马逊和 EMI 通过从一开始就提供无 DRM 的曲目,占据了音乐市场的主导地位。

有许多愚蠢的数字版权管理(DRM)方案,这让我不禁想知道为什么有些人能因为想出这些点子而拿到薪水,而我们这些理智的人却要为了每天的面包而奔波。索尼 BMG 因为偷偷在“受保护”的音乐 CD 上安装隐蔽的 rootkits 而被曝光,不止一次,而是两次。这不仅是对个人电脑的侵犯,如果是一个孩子而不是全球公司,这将是刑事起诉的行为,而且它还打开了这些电脑中的大安全漏洞。其他像铅气球一样不受欢迎的 DRM 想法包括定时炸弹式的音乐曲目,在经过一定天数后变得无法播放,尝试计数和限制复制的数量,以及订阅过期后变得无法播放的下载。所有这些都依赖于某种形式的中央授权和控制,在我看来,这需要未经授权的侵犯我们的个人事务,并且需要很少的服务提供商能够维持的可靠性。我有的黑胶唱片比我年龄还大——你认为即使没有 DRM 的干扰,数字曲目能存活多久?我无法理解能想出这种敌对、自我毁灭的“老大哥”策略的思维方式。

另一方面,工作被盗用也同样不好。录音艺术家有权获得他们录音作品的报酬;我不太看好那些说“免费提供你的录音并从现场表演中赚钱”的人。显然,他们从未表演过或制作过好的录音。我除了建议你尽可能善待你的付费客户外,没有其他智慧可以提供。在现实生活中,而不是娱乐业巨头居住的奇异世界中,如果你公平对待他们并做正确的事,大多数人会公平对待你,因为这是正确的事,而不是因为他们被迫这么做。

版权和法律问题

目前,在美国以及一些其他国家,版权法处于一个非常奇怪的位置。版权所有者的权利不断被延长,而公平使用受到打击,轻微侵权被升级为重大犯罪。创作者被排挤出他们自己作品的版权持有者,尽管这是一个老问题。正如 Courtney Love 在“Courtney Love Does the Math”中所说:

. . . 一位名叫 Mitch Glazier 的国会议员助手,在 RIAA 的支持下,向一个法案中增加了一个“技术修正案”,该法案将录音音乐定义为 1978 年版权法下的“雇佣作品”。

他在所有关于该法案的听证会结束后这样做。当艺术家们发现这一变化时,已经太晚了。法案正在送往白宫,等待总统签署。

版权法的微妙变化将在未来几年内为唱片公司的银行账户增加数十亿美元——这些数十亿美元本应支付给艺术家。现在,“雇佣作品”永久归唱片公司所有。

根据 1978 年版权法,艺术家可以在 35 年后收回他们作品的版权。如果你创作并录制了“Everybody Hurts”,至少在 35 年后你可以将其作为家族遗产保留。但现在,因为这个腐败的小混蛋,“Everybody Hurts”永远不会回到你的家族手中,现在可以被卖给出价最高的人。

. . . 顺便问一下,你认为唱片业使用了哪个法案来通过这个修正案?. . . 1999 年的卫星家庭电视法案怎么样?

这个迷人的小条款在 2000 年的《为雇佣作品制作的工作和版权修正法案》中被废除。但你看清了你面临的是什么。自己动手解决问题的方法之一是在你的作品下发布 Creative Commons 许可。有几个这样的许可,你可以在www.creativecommons.org/上了解所有关于它们的信息。这些许可允许你定义不同程度的重新使用和分发权限,从宽松到严格。当你寻找法律建议时,确保你找到一个对版权法的各个方面都了如指掌的律师,包括 Creative Commons。

注意,我说的是“当你寻找法律建议时”,而不是“如果你”。互联网上已经充满了非律师提供的法律建议,所以请自己找一位真正的律师来咨询。你可以在网上和图书馆找到各种信息,然后当你与律师会面时,你会准备得很充分。不幸的是,这是现代艺术家必须面对的一个必要部分。你可以靠豆子和米饭生活,你可以修补旧衣服,你也可以驾驶用线和胶带固定在一起的老车。但解决法律纠纷是困难的、昂贵的,而且往往不可能;预防要便宜得多,压力也小得多。

了解更多

请参阅第四章以了解如何在 CD 上放置现场表演的更多信息。第六章详细介绍了制作超高保真音频文件,而第九章则全部关于 Audacity 中的多轨录音和混音。

第九章. 多轨录音

无标题图片

在数字领域编辑和混音多个轨道比在模拟世界中要容易得多。无需等待磁带倒带,无需物理剪切和粘贴磁带——所有这些都是点击和拖拽的位操作。尽管 Audacity 不是重型多轨录音和编辑最复杂的应用程序,但你可以用它制作出色的单声道和立体声录音,甚至 5.1 和 7.1 环绕声。这是真正的产品,具有离散的轨道。

注意事项

这里的意思是分开的,而不是指保密能力。在音频中,“离散”是一个重要的术语,因为它告诉你何时你得到的是真正的产品,而不是模拟的。例如,环绕声高保真系统可以从立体声录音中模拟出 5.1 声道声音,而立体声录音只有两个离散通道。真正的 5.1 声道有六个离散通道。

Audacity 缺少了什么?它没有每个轨道的录音电平表,而且你不能在播放轨道时进行编辑。当你使用多通道录音设备时,你不能控制哪个输入连接到哪个轨道。多通道环绕混音仍然相当基础:你可以导出 5.1 和 7.1 环绕声,但 Audacity 没有提供帮助映射通道。Audacity 的优势在于为单声道和立体声播放的录音、编辑和混音。对于想要执行重型录音室魔法、进行多通道环绕并拥有最大控制的 Linux 和 Mac 用户来说,Ardour 可能是一个更好的选择,当然,Windows 和 Mac 用户也有许多其他高端音频制作套件可供选择。

那么,Audacity 能做什么呢?它将记录与你的录音接口支持的通道数和你的电脑处理能力相匹配的通道数。一些多通道录音接口的例子包括 M-Audio Delta 1010 PCI 声卡(10×10)、Edirol FA-101 FireWire 音频接口(10×10)、RME Hammerfall 声卡和 M-Audio NRV10,它是一个有用的模拟混音器和 10 通道 FireWire DAC/ADC 的组合。

Audacity 对一个项目中轨道的总数没有硬性限制;你可以一直添加轨道,直到你的电脑崩溃。Audacity 支持所有基本的轨道编辑和混音功能:混合匹配剪辑,时间移动和同步,叠加多个相同轨道或剪辑的副本,进行修复和特殊效果处理,并将混音输出到 1 到 32 个通道(WAV、AIFF 和 Ogg Vorbis;其他文件格式支持的通道更少)。在现实生活中,单声道、立体声和 5.1 环绕声(6 通道)是你最可能的选择。

轨道、通道和剪辑

让我们花点时间确保我们的术语使用正确。在 Audacity 中,单个音轨由单个波形表示,就像图 9-1 中所示。我称之为单声道音轨,以明确指出它不是一个立体声音轨。然而,在音频和 Audacity 中,音轨的定义有些模糊,因为它将立体声音轨和单声道音轨以相同的方式处理——尽管有两个通道和两个不同的波形,Audacity 将立体声音轨视为一个音轨,你对它所做的任何操作都会同样应用于两个通道。音轨也是一个包含多个歌曲的 CD、LP 或磁带中的单个歌曲。

这就是单个单声道音轨的样子——一个波形,无论在音轨上录制的声音或乐器有多少。

图 9-1. 这就是单个单声道音轨的样子——一个波形,无论在音轨上录制的声音或乐器有多少。

通道指的是音频的输入和输出。当你使用单个单声道话筒进行录音时,即使整个管弦乐队在演奏和合唱团在唱歌,这也是一个单独的输入通道。多通道录音接口允许你使用更多的麦克风和乐器插件,从而创建更多的音轨。

注意

编辑 > 首选项 > 设备中设置的输入通道数量必须与你的物理输入通道数量相匹配。

通过为每个声音和乐器配备自己的麦克风,你可以获得最大的灵活性和控制。录音室录音与现场录音大不相同——有时每个表演者都可能在单独的隔音隔间中,或者在不同的时间和地点进行录音,因此乐队成员可能从未同时出现在同一个物理位置。在单个表演者身上使用多个麦克风,然后操纵产生的多个音轨以创造绝对完美精彩(或者说是过度制作的混乱,视情况而定)是一种常见的做法。

在你将麦克风和乐器插入的物理录音输入时要小心——有些是单声道的,有些将是立体声的,有些可能需要幻象电源,而其他则用于各种其他目的。确保你正确地插入了设备——仅仅因为它适合并不意味着它是正确的。

注意

培养一个好习惯就是永远不要随意热插拔任何设备,除非你确定这样做是安全的。在连接你的电容式话筒之前,不要开启幻象电源。在电源开启的情况下,不要将任何设备插入你的放大器、预放大器、调音台等,或者至少确保所有音量控制都调至零。在拔插设备之前,请先关闭电源。大多数音频设备都能承受一定程度的滥用。但热插拔产生的噼啪声会令人烦恼,并可能损坏你的设备。

如果你在一个单声道录音输入上使用立体声麦克风,只有一个通道会录音,你将得到一个只有一个通道为空的立体声轨道,就像图 9-2 中所示。

这是将立体声麦克风插入单声道录音输入时会发生的情况。

图 9-2. 这是你将立体声麦克风插入单声道录音输入时会发生的情况。

如果这种情况发生在你身上,不要担心;只需使用轨道菜单将立体声轨道分离成两个轨道,然后删除空的那个。有两种分割轨道选项:分割立体声轨道会创建一个左轨道和一个右轨道,而分割立体声到单声道会创建两个单声道轨道。(您可以使用相同的菜单将两个单独的轨道合并成一个立体声轨道。)在混音到立体声时分配轨道的左右或单声道非常重要:左轨道进入左声道,右轨道进入右声道,单声道则进入两个声道。(有关更多信息,请参阅混音到立体声。)

低端板载音频芯片因声称具有立体声麦克风输入而臭名昭著,但只有一个通道工作。如果你在这些芯片上尝试使用单声道麦克风,它可能根本不起作用,所以我忍不住要给出一个明显的警告:在使用之前测试它。

注意

请参阅第二章以复习设置音频硬件,并查阅您的产品文档。警惕那些想要“帮助”你的人!这是你的设备,你不想得到那些不知道自己在做什么的人的帮助,这些人中有很多自认为是专家(例如,一生都在舞台上表演的专业音乐家,他们依赖旧的“乱敲直到发生什么”的技术)。你的平静心情和设备比他们的自负更重要。

输出通道类似于输入通道。如果你创建一个 5.1 环绕混音,它有六个独立的通道——左声道、右声道、中心声道、环绕左声道、环绕右声道和低频效果(LFE),你可以将单个单声道轨道导出为 5.1 环绕,如图 9-3 所示。图 9-3 展示了这个过程。我不知道你为什么想这么做,但如果你这么做,它就在那里。Audacity 支持最多 32 个输出通道。如果你有一个支持 32 个通道的播放设备,你将会有一个非常有趣的体验。对于所有这些通道,一个更现实的选项是将它们导出到一个 32 位的 WAV 文件中,或者 32 个单独的 WAV 文件(使用文件 > 导出多个),然后导入到一个更复杂的混音应用程序中进行高级混音和录音室魔法。例如,一些用户喜欢在 Audacity 中录制和编辑,然后在不同的程序中进行最终混音,这些程序做的是 Audacity 做不到的事情,比如支持 MIDI,或者有更复杂的多轨混音。由于 Audacity 是免费的,尝试不同的工作流程只需要一些时间,而无需任何费用。

使用 Audacity 自定义导出混音器从单轨创建 5.1 WAV 文件的有趣示例

图 9-3. 使用 Audacity 自定义导出混音器从单轨创建 5.1 WAV 文件的有趣示例

剪辑是轨道的片段。你可以用剪辑玩很多有趣的事情,比如通过移动单词来改变采访中的人说的话,制作循环,或者从不同的录音中抓取剪辑并将它们以新的不同方式混合在一起。你可以在单个轨道中放置多个剪辑,或者将每个剪辑放在自己的轨道上。你甚至可以使用时间移动工具将剪辑从一个轨道拖动到另一个轨道上(图 9-4)。

使用时间移动工具,剪辑可以独立地移动到任何地方,甚至可以移动到不同的轨道上。

图 9-4. 使用时间移动工具,剪辑可以独立地移动到任何地方,甚至可以移动到不同的轨道上。

如何制作多轨录音

有几种方法可以制作多轨录音。一种方法是通过多通道录音接口一次性录制所有轨道。另一种方法是在现有项目中在不同时间录制新轨道;这被称为叠加录音。管理多轨项目的另一种方法是运行多个录音会话,每个会话在自己的 Audacity 项目中,然后将这些轨道复制到一个单独的 Audacity 项目中。

对于一次录制大量轨道,我有一个 Focusrite Saffire Pro 26,这是一个出色的多通道 FireWire 录音接口。它具有八个麦克风前级放大器,幻象电源,两个 ADAT 银行(16 个通道),S/PDIF,24/192 数字 I/O,以及许多其他功能。图 9-5 显示了在 Audacity 中使用 Saffire 进行的四通道录音会话。正如你所见,它看起来并不特别:它只是同时录制了四个通道。Saffire 理论上可以一次处理 26 个录音输入,Audacity 可以毫无问题地处理;唯一的限制是我电脑的处理能力。(Audacity 版本在 1.3.8 之前的版本一次限制为 16 个输入。)

使用 Focusrite Saffire Pro 同时录制四个轨道的录音

图 9-5. 使用 Focusrite Saffire Pro 同时录制四个轨道

我的小型 M-Audio MobilePre USB 可以一次录制四个输入。然而,它实际上是一个仅具有两个离散输入和输出通道的立体声录音接口。因此,录制四个输入意味着每个通道上都有两个输入组合在一起,而不是可以单独操作的四个轨道,只有两个。这再次说明了在广阔的音频世界中,有许多做事的方法。

许多高端声卡和录音接口被设计成可以组合使用,然后它们在 Audacity 中表现为一个单一接口。Audacity 没有能力组合多个录音接口;它必须看到一个具有多个通道的单个设备。Windows 和 Mac 用户可以获得特殊的驱动程序和管理软件来完成这项工作。幸运的话,你也可以组合低端声卡。然而,根据我的经验,在任何一个平台上组合廉价声卡都是痛苦且不可靠的,所以我将假装这样的选项不存在。

注意

记住,Audacity 支持几乎无限的撤销和重做,因此你可以安全地实验。使用 ctrl-Z 或编辑 > 撤销来撤销更改,使用 ctrl-shift-Z 或编辑 > 重做来重做。

当你想将如 WAV 或 FLAC 等音频文件添加到你的项目中时,请使用文件 > 导入 > 音频将它们导入到 Audacity 项目中。文件 > 打开将启动一个新的 Audacity 会话,而文件 > 导入 > 音频则将音频文件打开到当前项目中。你不能将一个 Audacity 项目导入到另一个 Audacity 项目中,但你可以在两个或更多项目之间复制轨道。

轨道菜单

图 9-6. 轨道菜单

熟悉轨道菜单(图 9-6),因为你将经常使用它。

这里有一些需要注意的事项。你可以使用轨道菜单来分割立体声轨道;点击分割立体声轨道/分割立体声为单声道。然后,为了自己的精神健康,给每个轨道起一个描述性的名字。

你可以将两个单声道轨道合并成一个立体声轨道。它们必须相邻,并且你需要在最上面的轨道的轨道菜单中选择制作立体声轨道。然后 Audacity 会自动将其与下面的下一个轨道合并。如果轨道没有在一起,从轨道菜单中选择移动轨道上下,或者用鼠标拖动一个轨道,通过在轨道标签上抓住它来实现。(如果你不记得 Audacity 的所有部分都叫什么,请参阅第一章。)

播放技巧和窍门

如你从勤奋学习的第一章中回忆的那样,默认情况下,当你按下播放按钮时,Audacity 会同时播放所有轨道。按空格键也会开始播放。要听一个轨道,点击轨道菜单中的独奏。要听一些轨道但不是所有轨道,点击不想听的轨道上的静音按钮。ctrl-U 静音所有轨道,shift-ctrl-U 取消静音所有轨道。将光标放在时间标尺上的任何起始点上;当它变成一个小手时,点击即可从该点开始播放。你可以这样跳过整个轨道,而不使用停止/播放按钮。

在时间标尺上创建播放区域以播放选定区域。

图 9-7。在时间标尺上创建播放区域以播放选定区域。

你可以通过在时间标尺上点击并拖动来创建一个播放区域,快速播放轨道的选定部分。这将立即播放,然后播放区域消失。

你可以通过通常的方式选择轨道的一部分来创建一个持久的选定区域,即使用选择工具点击并拖动。然后点击播放按钮来仅播放该选定区域,或者点击 shift-Play 来循环播放选定区域。按 ctrl-B 为选定区域创建一个区域标签(有关区域标签的更多信息,请参阅创建和管理标签)。按C(代表剪切)来预听剪切选定部分后轨道将听起来像什么。默认的切入和切出长度为 1 秒;你可以在编辑 > 首选项 > 播放中更改此设置。

快速播放曲目的一部分,可以通过点击标记一个停止点,将光标定位在标记的左侧(不要点击,只需悬停)然后按B键。播放将从光标所在位置开始,并在你的标记处停止。你也可以反过来操作,将光标定位在标记的右侧,然后按B键,它将从所选内容播放到光标位置。

标签轨道

标签轨道对于跟踪项目中的曲目活动非常有用。你可能还记得第三章中提到的标签,它们被用来将复制自黑胶唱片的长时间曲目分割成单独的歌曲轨道。当你编辑多个轨道时,你也可以将它们用作书签和笔记,以及创建对齐标记。每个音频轨道都可以有自己的标签轨道(图 9-8)。通过选择轨道 > 添加新 > 标签轨道来创建新的标签轨道。通过用光标抓住轨道标签并拖动它们,或者使用轨道菜单的移动轨道上下选择来定位标签轨道。

你可以使用任意数量的标签轨道。

图 9-8。你可以使用任意数量的标签轨道。

如果你依赖于标签轨道,那么在备份 Audacity 项目时需要格外小心,因为它们仅存在于 Audacity 内部。标签轨道可以像音频轨道一样导出和导入,但遗憾的是(截至 Audacity 1.3.12),你不能导出多个标签轨道。如果你尝试导出多个标签轨道(文件 > 导出标签),它们将被合并成一个单独的文本文件,并且在导入时,你将得到一个包含所有轨道标签的单个标签轨道。

你可以将标签轨道放置在最上方,并像指挥家的乐谱一样使用它,为整个项目提供笔记和计时标记。

创建和管理标签

点标签标记轨道上的单个点,区域标签标记一个区域。

图 9-9。点标签标记轨道上的单个点,区域标签标记一个区域。

标签有两种类型:点标签区域标签。在第三章、第四章和第五章中,我们使用点标签将长时间曲目分割成单独的歌曲。区域标签标记一个选择,如图图 9-9 所示。

点标签很容易创建。停止播放,使用选择工具在您的轨道上点击,您想要放置新标签的位置,然后按 ctrl-B。输入您的标签名称或您想要的任何文本,然后按回车键。您也可以选择轨道 > 在所选位置添加标签。要删除标签,按退格键直到标签文本消失。

播放时按 ctrl-M 键可以添加标签;这是 Audacity 中少数几个不需要先停止所有操作的功能之一。当您有多个标签轨道时,请记住首先选择您想要添加新标签的轨道。(点击其轨道标签以选择它。)

看看标签上的小手柄,角度和圆圈。抓住圆圈来移动标签。拖动角度手柄来创建或调整区域标签的大小。通过拖动角度手柄直到所有手柄合并,将区域标签更改为点标签。

您可以通过几种方式创建区域标签。一种方式是选择音频轨道的一部分,然后选择轨道 > 在所选位置添加标签(或直接按 ctrl-B)。另一种方式是通过拖动其角度手柄来拉伸点标签。小角度和圆圈会改变它们在相邻区域标签时的行为。小圆圈手柄创建并移动一个公共边界,公共边界用角度手柄分隔(图 9-10)。

圆圈手柄移动整个标签,角度手柄创建和调整区域标签的大小。您可以将区域标签的边界连接起来,然后使用圆圈手柄移动边界,您也可以使用角度手柄将它们分开。

图 9-10. 圆圈手柄移动整个标签,角度手柄创建和调整区域标签的大小。您可以将区域标签的边界连接起来,然后使用圆圈手柄移动边界,您也可以使用角度手柄将它们分开。

按下制表键可以向前浏览您的书签,按住 Shift 键再按制表键可以向后浏览。选择轨道 > 编辑标签来快速编辑和重新排序它们。标签会编号以显示它们属于哪个标签轨道(图 9-11)。

选择轨道 > 编辑标签将所有标签放在一个地方以便于编辑和重新排序。注意标签是按照它们的标签轨道编号的,1、2 和 3。

图 9-11. 选择轨道 > 编辑标签将所有标签放在一个地方,便于编辑和重新排序。注意标签是按照它们的标签轨道编号的,1、2 和 3。

使用标签编辑多个轨道

你可以使用标签在多个轨道上标记点或片段。假设你想要删除两个音频轨道上的 10 秒片段。用区域标签标记这一点,然后点击标签文本内(图 9-12).

使用区域标签选择跨多个轨道的轨道片段

图 9-12. 使用区域标签选择跨多个轨道的轨道片段

这会将标签文本字段变为白色,并在标签轨道以上的所有轨道中选择一个 10 秒的片段,包括其他标签轨道。如果这包括你不希望受影响的轨道,请取消选择额外轨道(shift-click 轨道标签)。按 ctrl-X 或选择编辑 > 剪切,选择将消失。你可以使用此功能跨多个轨道进行任何编辑操作。你可以通过更改区域标签来移动选择或更改其大小。

对于这些操作,不需要使用区域标签,因为你可以使用选择工具在多个轨道上做出选择。键盘也可以使用,使用上箭头和下箭头键移动光标,使用 shift 键和箭头键调整选择的大小。

校准和移动轨道

有许多方法可以在时间和轨道顺序中移动轨道。Audacity 有几个很好的工具可以移动和校准你的轨道。

移动轨道向前或向后的一种方法是使用时间移动工具(图 9-13)。时间移动工具可以将整个轨道向前或向后移动时间。

这非常简单:只需单击,按住鼠标按钮,并将波形向左或向右拖动。你甚至可以拖动到轨道的开始之前,并向前移动时间,这在轨道中的小箭头中有所指示。图 9-14。这是非破坏性的,你可以再次将其拖出来。

选择时间移动工具

图 9-13. 选择时间移动工具

当你将时间移动到轨道开始之前时,会出现两个小箭头。

图 9-14. 当你将时间移动到轨道开始之前时,会出现两个小箭头。

当你正在移动轨道时间,并且它们与其他轨道完美对齐,或者正好从零开始对齐时,Audacity 会显示一条垂直的黄色线。Audacity 称这为捕捉指南。如果有多个边界并且它们太靠近,捕捉指南会变得混乱并且无法工作。放大以给它一些空间。

只要轨道是单一不间断的波形,时间移动工具就会移动整个波形。要将轨道分成独立的段,使用选择工具点击标记你想要分割的位置,然后选择编辑 > 分割(或按 ctrl-I)。选择线变为白色,现在你有两个可以独立时间移动的段。

注意

如果启用了链接轨道,带有标签轨道的轨道将不会分割。禁用链接轨道以更改此设置。

要重新连接分割的轨道,将段移动回一起。当它们接触时,黄色的捕捉指南线会出现。然后切换到选择工具,选择跨越连接的选择,然后选择编辑 > 连接或按 ctrl-J。如果有间隙,选择编辑 > 连接将用静音填充它。

轨道 > 对齐轨道菜单中查看一系列有用的轨道对齐命令。假设你已经对多个轨道进行了时间移动,它们分布得四处都是,因此你想重置一切并重新开始。选择你想要对齐的轨道,选择轨道 > 对齐轨道 > 对齐轨道一起,然后选择轨道 > 对齐轨道 > 对齐轨道与零。嗖!一切都被重置为从零开始。

注意

不要包括标签轨道,因为它们总是从零开始,这将防止带有任何偏移的音频轨道对齐到零。通过在它们的轨道标签上按住 shift 点击来取消选择标签轨道。

使用光标对齐是一种快速将轨道移动精确数量的方法。以下是操作方法:假设你想要在轨道开头插入 10 秒的时间偏移。在 10 秒处点击以标记它,然后选择轨道 > 对齐轨道 > 与光标对齐,将轨道的开始移动到该点。将结束与光标对齐使轨道的末尾与光标对齐。

使用选择开始对齐和使用选择结束对齐与使用光标对齐类似,只是轨道是相对于选择移动的。例如,如果你有一个跨越 5 到 10 秒段的选择,使用选择结束对齐将轨道定位在 10 秒标记处。使用选择开始对齐则相反,使其从 5 秒标记处开始。

将结束与选择开始/结束对齐与对齐光标工作方式相同,只是它们相对于轨道的末尾。

使用标签的一个巧妙技巧是在需要时间移动多个轨道时创建一个对齐点。为此使用点标签:创建您的点标签,单击标签文本,然后从标签延伸到所有上方轨道的线条。使用时间移动工具,当轨道(或轨道)的开始或结束与您的点标签完美对齐时,黄色的捕捉引导线将出现。

轨道 1、2 和 4 已被选中。

图 9-15. 轨道 1、2 和 4 已被选中。

轨道对齐也可以在时间标尺上的任意任意点上不使用标签进行。使用选择工具,在单个轨道的任何位置单击以标记您的对齐点,然后通过选择其他轨道(在轨道标签上 shift-click)将光标向上或向下扩展到其他轨道。shift-click 也可以取消选择。您可以使用此方法选择任意轨道,如图 9-15 所示。然后使用时间移动工具将对齐到光标标记或选择轨道 > 对齐轨道 > 与光标对齐

链接轨道和轨道组

Audacity 1.3.9 中出现的一个(有时可能令人困惑)的新功能是链接轨道按钮(编辑工具栏)。默认情况下应该激活(按下)此按钮;这可以通过时间变化、速度变化、剪切、粘贴和其他更改保持标签轨道与音频轨道对齐。当链接轨道妨碍您时,可以通过单击(抬起)链接轨道按钮或选择轨道 > 链接音频和标签轨道并取消选中复选框来关闭链接轨道。

标签轨道与音频轨道或其上方的轨道链接,直到出现另一个标签轨道;这些被称为轨道组。通过轨道 > 添加新 > 标签轨道创建一个新的标签轨道。它将出现在现有轨道的底部,您可以通过拖动轨道标签或从轨道菜单中选择移动轨道上下来移动它。您可以通过插入空白标签轨道来将轨道组与其他轨道分开。

当您在轨道组中使用时间移动工具时,组中的每个轨道作为一个单元移动。当您删除一个轨道的一部分时,组中的每个轨道都会删除相应的部分。当您将音频片段粘贴到一个轨道中时,其他轨道会接收到相应长度的静音。当您使用效果 > 改变速度改变速度时,效果会应用于组中的所有轨道。标签会通过所有这些变化保持同步。

注意

在 Audacity 2.0.x 系列中可能无法启用链接轨道。它们首次出现在 Audacity 1.3.9 版本中,并应在 Audacity 2.1.x 测试版系列中回归。它们的行为可能会改变,因此请检查您的 Audacity 发布说明。

同时时间移动多个轨道

如果您想同时将多个轨道移动相同的时间,怎么办?shift-click 轨道标签来选择您想要时间移动的轨道,或者按 ctrl-A 选择所有轨道,然后使用时间移动工具移动它们(图 9-16).

调整多个选中轨道的时间。注意,选中的轨道(1 和 3)被变暗了。

图 9-16. 调整多个选中轨道的时间。注意,选中的轨道(1 和 3)被变暗了。

如果您的 Audacity 版本包含链接轨道功能,请禁用它,否则时间移动将无法正常工作。

分割轨道

分割轨道是将长轨道分割成独立的剪辑,这样您就可以根据需要移动它们。有时您需要移动一段一秒或两秒来与其他轨道对齐或分离同时说话的两个人。有时您可能想要将一个轨道分割成许多短剪辑。要创建剪辑,将选择工具定位到您想要分割的位置,然后按编辑 > 分割。现在您有两个剪辑,可以使用时间移动工具来移动它们。

选择**编辑** > **分割新建**创建一个包含剪切片段的新轨道。

图 9-17. 选择编辑 > 分割新建创建一个包含剪切片段的新轨道。

选择编辑 > 分割剪切来剪切选中的轨道部分并留下一个间隙,这样轨道长度保持不变。被剪切的片段将被放置在剪贴板上,可以粘贴(ctrl-V 或编辑 > 粘贴)到另一个位置。

选择编辑 > 分割删除将删除选中的部分。

选择编辑 > 分割新建创建一个新轨道并将剪切的部分移动到它上面(图 9-17).

与剪辑一起工作

如果您正在处理短剪辑,而不是我们之前看到的长时间轨道,看起来就像图 9-4。您可以在同一轨道上拥有多个独立的剪辑。每个剪辑都可以独立进行时间移动,甚至可以使用时间移动工具拖动到其他轨道上。您可以对单个剪辑进行编辑,例如更改振幅、应用效果、删除或粘贴额外材料以及修复缺陷。唯一不能做的是在导出共享同一轨道的独立剪辑时控制通道映射,因为这是按轨道进行的,所以任何想要这样控制的剪辑都需要在它们自己的轨道上。

Audacity 的 Snap Guide 功能

图 9-18. Audacity 的 Snap Guide 功能

当你想精确选择一个剪辑时,Audacity 的 Snap Guide 功能非常有用,因为当你正好位于其边界上时,你会看到黄色的线条出现(图 9-18).

选择多个剪辑有点棘手。按 ctrl-A 键选择所有轨道。要移动所选的一批剪辑,首先使用选择工具在时间轴上标记出跨越所有要移动的剪辑的片段。然后在轨道面板中使用 shift 键点击来选择轨道,然后使用时间移动工具来移动它们。这相当笨拙,你不能随意跳过并选择任意一批剪辑(图 9-19).

你只能在时间轴上的公共区域选择剪辑。在这个例子中,前三个轨道中带有暗色区域的剪辑将一起进行时间移动。

图 9-19. 你只能在时间轴上的公共区域选择剪辑。在这个例子中,前三个轨道中带有暗色区域的剪辑将一起进行时间移动。

轨道内的时间移动

时间移动工具非常适合将整个音频片段向前或向后移动,但如果你想在轨道中间插入一个中断或对轨道的一部分进行时间移动怎么办?Audacity 有几种不同的方法可以做到这一点。我最喜欢的创建中断或填充轨道的方法是选择生成 > 静音。这避免了分割轨道或删除任何内容;它所做的只是插入一段你想要的任意时长的绝对静音。将选择工具定位到你想要静音开始的位置,选择生成 > 静音,输入静音的时长,然后点击确定(图 9-20).

生成静音

图 9-20. 生成静音

Audacity 为你提供了多种选择,用于设置静音的时长。

图 9-21. Audacity 为你提供了多种选择,用于设置静音的时长。

如图 9-21 所示,你可以选择多种方式来设置静音的时长:小时、秒、毫秒以及各种帧率,这些内容我将在下一节进行解释。

天数、小时、秒和毫秒都很直接,我钦佩那些用天数来衡量音频文件持续时间的人。样本显示根据您项目的采样率显示的音频样本数量;例如,当您的项目采样率为 44,100 Hz 时,一秒钟的音频是 44,100 个样本。

另一种方法是把轨道分成两个或更多部分,然后移动它们以创建所需持续时间的间隔。参见对齐和移动轨道以了解如何做到这一点。

节拍器轨道

对于由略微不同的速度引起的同步问题,最好的治疗方法是在您录制时让每个人都保持节奏。换句话说,关键是预防。你知道那些大型的、昂贵的录音室,有所有的隔音和昂贵的设备吗?他们不会像必须那样依赖编辑魔法来修复缺陷。这就是为什么他们要隔音并多次录制。这就是为什么他们使用节拍器来确保所有演奏者保持节奏。

节拍器并不昂贵,每个录音室都应该有一个。像许多其他电子小玩意儿一样,它们有各种各样的风格、功能和价格。只需选择一个既有静音闪烁又有可听见的点击节拍即可。如果它还包含调音器、正弦波发生器、接收天气预报和制作三明治,这些都是额外的优点。

Audacity 会为您生成节拍器轨道。最好使用独立的节拍器,因为它不使用任何 CPU 周期,但如果你需要它,它就在那里。如果你已经安装了 C音频插件套件(www.de/dsp/caps.html),请在“生成”菜单中查找 C点击节拍器。你会看到一个菜单,就像图 9-22 中那样,你可以设置每秒的节拍数、音量和持续时间。阻尼接受从 0.1 到 0.9 的值。阻尼使得在较高的阻尼值时节拍器听起来被抑制,在较低的值时听起来更谐振。

与节拍器轨道类似的是点击轨道。与节拍器轨道不同,它在每一小节的开始都有一个重音节拍。重音和非重音节拍的音高由 MIDI 音符数值控制。MIDI 音符编号从 0 开始,到 127 结束,跨越近 11 个八度。60 号是中 C,每个八度有 12 个音符(参见表 9-1 以获取 MIDI 音符编号速查表)。

在“生成”菜单中查找 C*点击节拍器插件。

图 9-22。在“生成”菜单中查找 C*点击节拍器插件。

表 9-1. 音高及其对应的 MIDI 音符编号值

音高 MIDI 音符编号
C 60
C# 61
D 62
D# 63
E 64
F 65
F# 66
G 67
G# 68
A 69
A# 70
B 71

如果您想知道为什么没有使用降号符号,那是因为键盘上没有降号符号。

图 9-23 展示了“生成”>“点击音效”的配置面板。(在 Linux 上,它位于“生成”子菜单的更深层次,具体取决于安装了哪些插件。)首先通过选择“轨道”>“添加新轨道”>“音频轨道”创建一个新的空轨道,然后打开点击音效。

配置点击音效

图 9-23. 配置点击音效

大多数选项应该是自解释的。小节数量决定了轨道的长度。噪声点击共振和单个点击持续时间影响音质;这两个值越高,点击音效越音乐化。

重复录音

重复录音是在听现有轨道或轨道的同时录制新轨道。重复录音是自行录制整个交响乐的一种方式,一次录制一个轨道。当然,它也适用于更简单的项目,例如录制自己演奏几种不同的乐器并唱歌,与自己进行相当和谐的合唱,或者当除了鼓手之外的人都到了,您将没有她(她可以稍后录制她的部分)。

启用重复录音以便在录制新轨道时可以听到现有轨道

图 9-24. 启用重复录音以便在录制新轨道时可以听到的现有轨道。

让我们快速进行一次重复录音。首先打开一个现有的音频轨道或录制一个新的轨道。然后在传输菜单中,启用重复录音(图 9-24 展示了一个简单的重复录音会话。第一轨的播放被路由到耳机中,我们的隐形独奏者在第二轨上与它一起唱歌。

在听第一轨的同时录制新轨道

图 9-25. 在听第一个轨道的同时录制新轨道

测量和修复延迟

当你进行叠加录音时,延迟是一个常见问题,因为播放时总是存在一些延迟。通常,播放时的少量延迟并不重要,因为我们只是在听,声音不需要与其他任何东西同步。但是,当你进行叠加录音时,任何延迟都会导致新轨道与旧轨道不同步。演示这一点的一个简单方法是记录自己数到 10。然后叠加第二个轨道,再次数到 10,同时尝试匹配第一个轨道。播放它们,很可能会发现第二个轨道与第一个轨道不同步。

注意

总是确保编辑 > 首选项 > 录音 > 软件回放未勾选。使用软件回放可以让你监控你正在录制的声音,但这是最糟糕的方法,因为它会增加延迟并使用 CPU 周期。最好使用录音界面的监控端口。

Audacity 允许你在编辑 > 首选项 > 录音 > 延迟中补偿这种延迟。默认的延迟校正值是 130 毫秒,这对你系统来说可能并不正确。当你叠加录音时,你可以看到这种校正的效果,因为当你停止录音时,Audacity 会根据延迟校正值将新轨道进行时间移动。这种时间移动以通常的方式用一对箭头在波形图的左侧表示(图 9-26

图 9-26. 通过时间移动自动应用延迟校正由一对箭头表示。

获取正确延迟校正值的一种方法是通过试错。一种简单的方法是录制一个点击或节拍器轨道,然后在一个你尝试匹配节拍轨道的声乐轨道上叠加。当然,你可能会觉得对着麦克风说“滴答滴答滴答”或“ONE two three four”很傻,但这是有效的。确保选择工具栏上的“自动对齐”复选框未勾选,并不断调整延迟值,直到听起来正确。

一种更精确的方法是使用回环电缆来测量延迟。这听起来可能有些奇特,但你所做的一切只是将你的录音界面的播放输出连接回录音输入。如果是内置声卡,将线路输出连接到线路输入。如果是 USB 或 FireWire 接口,这取决于你的设备和它有什么样的连接器,但任务仍然是相同的——将播放输出连接到录音输入。

然后将延迟校正设置为 0。确保选择工具栏上的“Snap To”复选框未勾选。选择“Length”单选按钮,并将时间参数设置为 hh:mm:ss + 毫秒。

接下来,生成一个 30 秒长、每秒 180 拍子的节拍器或点击轨道。每秒的拍子数可以是任何值;我更喜欢较快的拍子,因为它更容易测量。

由于延迟,叠加的轨道与第一轨不对齐。

图 9-27. 由于延迟,叠加的轨道与第一轨不对齐。

打开叠加录制(Transport > Overdub (on/off)),在设备工具栏上选择播放和录音设备的录音接口,并按录音按钮。您应该会看到类似图 9-27 的东西。

当您完成录音后,放大直到您可以选择顶部轨道上的点击和底部轨道上相应点击之间的间隔。如果您不习惯使用鼠标,请使用 shift 键和箭头键来标记选择。(使用箭头键前后左右上下移动,并使用 shift 键和箭头键进行选择。)您将看到类似图 9-28 的东西。

从第一轨的第一个节拍开始选择间隔,到第二轨的第一个节拍开始,以测量延迟

图 9-28. 从第一轨的第一个节拍开始选择间隔,到第二轨的第一个节拍开始,以测量延迟

现在您在选择工具栏中有一个长度值。在我的例子中,那是 177 毫秒,相当多。如果您愿意,可以放大以获得最精确的测量。您可能永远无法达到零延迟,但可以非常接近。叠加的延迟校正总是取负值,因为新轨道总是落后于旧轨道。如果您更改录音接口,应重复回环测试,因为不同设备有不同的延迟。

当您阅读有关延迟的内容时,您会发现许多关于它的热烈讨论,以及许多关于英雄般的低延迟壮举的吹嘘,例如“我将我的延迟降低到三毫秒!”这是可以接受的,尽管有些可疑,但保持一点视角是好的。为了稳定性或避免因 CPU 跟不上的跳跃和卡顿而牺牲超低延迟是没有好处的。在配音过程中,延迟很重要,Audacity 通过其可配置的延迟校正功能帮助您。当您使用软件监控时,这也很重要,这就是为什么我更喜欢使用带有零延迟监控端口的录音接口。当您在音频链中添加额外的停止点时,例如外部的特殊效果处理器时,这也很重要。当您弹奏音符时,您希望声音发出,而不是延迟。

您可以通过使用高速多核处理器和优化计算机以及针对音频制作进行调优来降低您的音频制作计算机的延迟。第十三章和第十四章告诉您如何做到这一点。

改变节奏

尽管您尽了最大努力,但有时您的音轨节奏会偏离同步。如果您是朋克乐队的一员,那没关系,但否则您可能希望纠正这一点。选择效果 > 改变节奏,这将改变节奏而不改变音调。如果知道要使用哪些值,这很容易,但不幸的是,Audacity 没有节奏检测器。编写节奏检测插件的人将是一个大英雄。我使用秒表并在播放期间数出节拍。可能需要一些尝试和错误,但通常比重新录制要容易。

NTSC、PAL 和 CDDA 帧

这是对帧的简化解释。如果您想制作电影音轨,那么这只是一个关键概念的介绍,您将需要了解更多。

值用于将分割点精确地放置在视频和音频帧的边界处。在“选择”工具栏中勾选“吸附到”复选框,将时间值设置为适当的帧类型,然后在您进行分割或剪切时,它们将正好匹配帧。任何在帧边界之外的音频都将丢失,并可能产生点击声。

国家电视系统委员会(NTSC)的帧率适用于北美、一些南美国家和少数其他国家的模拟广播电视。NTSC 的降帧率为每秒 29.97 帧(fps),而 NTSC 的非降帧率为每秒 30 帧。Audacity 支持这两种格式。为什么是两个?为什么是奇怪的 29.97 这个数字?这是一个从黑白电视时代就有的旧标准。黑白广播的帧率是真正的 30 帧每秒,但当彩色被添加到广播信号中时,由于各种技术原因,帧率被降低到 29.97 帧每秒。现在请特别注意,因为我将运用我所有的强大解释能力,以一种普通人、非视频工程师可以理解的方式解释降帧和非降帧 NTSC 帧率之间的差异。这在人类历史上从未做过;你在这里是第一个看到的。

NTSC 的降帧和非降帧帧率只有一个区别:它们使用不同的时间码来控制播放速度。节目的长度没有差异,只是在播放速度上有一点小小的差异。术语降帧是不幸的,因为它普遍被认为视频帧被丢弃了,但这并不是真的。视频时间是通过计算视频帧来衡量的。当你以真正的非降帧 30 帧每秒拍摄一小时的视频时,你的一个小时的工程将包含正好 108,000 帧。如果它没有先转换为降帧就播出,它将运行大约 1 小时 3.6 秒,因为以 29.97 帧每秒的速率,每小时有 107,892 帧。所以,在一小时结束时,会剩下 108 帧。

如果你愿意做数学计算,你会发现两者之间有 1%的差异。自然地,随着时间的推移,这会导致广播员的烦恼。这也给需要准确测量剪辑和场景长度的电影编辑带来了麻烦。

这种差异通过在降帧时间码中插入一点故意的健忘和自我欺骗来纠正。使用 NTSC 降帧,你的电影以 30 帧每秒播放,但它假装是 29.97 帧每秒,因为这是 NTSC 电视广播的要求。每个视频帧都被计算,直到 1%的差异累计到一个完整的帧。然后时间码假装那个帧不存在,不计算它,并继续在下一个帧上计数。所以尽管你的电影仍然有它的原始 108,000 帧,但健忘的时间码播放它认为只有 107,892 帧,但实际上是 108,000 帧。由于它欺骗自己没有看到那些其他的 108 帧,所以它们仍然被播放,电影按时结束,每个人都高兴。

这听起来很复杂和奇怪,但在视频工程的世界里,这是一个优雅的解决方案,它对遗留的广播基础设施的干扰最小。随着彩色的出现,另一种选择是彻底翻新整个电视广播系统以适应新的彩色标准。

所有 NTSC 电视广播商都要求提交给他们的母带使用 NTSC 降帧。如果你在 Audacity 中编辑电影音轨,你可以精确匹配正确的帧率。

相位交替线(PAL)是地球上大部分地区的彩色电视广播标准:澳大利亚、亚洲的大部分地区、南美洲、欧洲、格陵兰和一些非洲国家。它使用 25 fps 的帧率,Audacity 支持这一帧率。

传统电影电影是 24 fps。

如果你正在为 DVD 制作音频轨道,你可以使用 NTSC、PAL 或 24 fps。对于网络流媒体,你可以使用你想要的任何帧率。

光盘数字音频(CDDA)的 75 fps 帧率用于音频 CD。我们在第三章中学习了这一点,用于将旧模拟媒体转换为 CD。例如,当你将黑胶唱片复制到 Audacity 作为一个长轨道,然后分割轨道成单独的歌曲时,选择 CDDA 帧率确保所有分割都将与 CDDA 帧匹配,并且你不会因为音频与 CDDA 帧率不同步而产生点击声。

创建循环

有些人在循环上完全失去了控制。循环是反复播放的剪辑,例如,将几秒钟的鼓点变成长鼓点,从短剪辑中创建背景音乐轨道,或者催眠般地重复—— whatever pleases you。你可能见过使用循环将几分钟的音乐扩展为背景音轨的低成本纪录片。

创建简单循环很简单。从一个单个短剪辑开始。选择效果 > 重复。输入你想要重复的次数。Audacity 甚至为你做了算术(图 9-29)。

通过使用短剪辑并选择效果 > 重复创建简单循环

图 9-29。通过使用短剪辑并选择效果 > 重复创建简单循环

你可以循环一个剪辑、整个轨道或轨道中的选择。重复的部分将被附加到原始选择上,所以如果你的选择在轨道的中间,那么重复也将位于中间,从选择的右侧开始。

立体声混音

当你完成所有的编辑和清理工作,准备将你的轨道混音到立体声时,进入单个轨道的轨道菜单,并将它们分配到适当的左、右和单声道。左声道轨道在混音时进入左声道,右声道轨道进入右声道,单声道轨道映射到两个声道。在 Audacity 中,立体声轨道的顶部通道是左声道,底部通道是右声道。

注意

要了解更多关于清理轨道、修复问题和特殊效果的信息,请参阅 第三章,第四章,第十二章 和 第十一章。

声像滑块调整单声道和立体声轨道的左右平衡。

图 9-30. 声像滑块调整单声道和立体声轨道的左右平衡。

你现在可以选择调整每个单声道或立体声轨道的声像,这意味着调整它们的左右平衡以增强立体声效果。你可以通过轨道面板上的声像滑块或首次出现在 Audacity 1.3.8 中的新式混音板上的声像滑块来完成此操作。声像滑块不会更改你的项目文件;它只影响 Audacity 中的播放和你的导出声音。在 Audacity 中调整播放时的音量,这样你可以确切地听到你的导出声音。这仅在单声道和立体声轨道上工作,不适用于左右声道。图 9-30 显示了它的外观。

声像滑块的旁边是增益滑块,用于调整轨道音量。就像声像一样,增益不会更改你的项目文件,但只控制你的导出声音。这也可以在播放时进行调整。

Audacity 有几种方法可以将你的轨道混音并渲染成立体声轨道。首先确保在 编辑 > 首选项 > 导入/导出 对话框中选择了“始终将所有轨道混音到立体声或单声道(s)通道”。

现在请选择 轨道 > 混音和渲染。这将用新的立体声轨道替换你的轨道。如果你不想用新的立体声轨道替换项目轨道,请不要选择 轨道 > 混音和渲染,但请记住那个巧妙的快捷键 Ctrl-Shift-M(Audacity 1.3.4 及更高版本)。这将混音并渲染一个新的立体声轨道,它将出现在你的单声道轨道下方(图 9-31)。

现在你已经有一个混合好的立体声轨道,准备进行更多编辑或导出到任何可播放的格式。如果你选择了使用 Ctrl-Shift-M 命令进行混音和渲染,你可以通过选择轨道(点击轨道标签)然后选择 文件 > 导出选择 来仅导出你的新立体声轨道。

按下 Ctrl-Shift-M 混音和渲染可保留原始轨道并创建一个新的立体声轨道。

图 9-31。按下 ctrl-shift-M 进行混音和渲染会保留您的原始轨道并创建一个新的立体声轨道。

自定义混音板

这里有一个关于混音板的酷技巧:您可以通过使用某些关键词和缩写来使图标与您的轨道名称匹配(图 9-32

图 9-32。混音板图标与您的轨道名称匹配。

我通过在网上浏览www.audacity.cvs.sourceforge.net/audacity/audacity-src/的源代码学习了这些名称。据我所知,这些名称尚未在其他地方进行记录。

  • 乐器:声学,吉他,gtr

  • 乐器:声学,钢琴,pno

  • 后奏,人声,bg,vox

  • 拍手

  • 鼓,dr

  • 电动,贝斯,吉他,bs,gtr

  • 电动,吉他,gtr

  • 电动,钢琴,pno,键

  • 踢鼓

  • 循环

  • 管风琴,org

  • 打击乐

  • 萨克斯管

  • 弦乐器,小提琴,大提琴

  • 合成器

  • tambo

  • 小号,horn

  • 黑胶唱片机

  • 钢片琴,vibes

  • 人声,vox

响度过大!削波!

在这个阶段,确保视图>显示削波被勾选是很重要的。这将以红色条形突出显示您新立体声轨道中的任何削波部分。当多个轨道合并为单个轨道时,它们会变得更响,因此削波是常见的混音问题。如果您的新的混音轨道有削波,您需要返回,降低一些音量,然后再次混音和渲染。

双击“平衡”和“增益”滑块以打开一个小窗口,您可以在其中输入您的值。

图 9-33。双击“平衡”和“增益”滑块以打开一个小窗口,您可以在其中输入您的值。

在更改任何内容之前,首先检查您的“平衡”和“增益”滑块。即使您无意移动它们,这些滑块也很容易移动。仔细将光标定位在滑块按钮上,并单击而不移动它,它将弹出确切值。如果您移动滑块有困难,双击它以打开一个小窗口,您可以在其中输入您的平衡或增益值(图 9-33")). 您可以将音轨映射到多个通道。

将您的音轨映射到导出时的通道(注意底部的通道滑块)

图 9-34。将您的音轨映射到导出时的通道(注意底部的通道滑块)

多声道环绕

您可以使用 Audacity 导出为 3.1,5.1,或 7.1 环绕声,或您想要的任何多声道组合,使用自定义混合选项。您如何知道哪个通道对应什么?这个方便的列表显示了 WAV 的通道映射:

  1. 前左

  2. 前右

  3. 前中心

  4. 低频

  5. 后左

  6. 后右

  7. 中心前左

  8. 中心前右

  9. 后中心

  10. 侧左

  11. 侧右

  12. 顶部中心

  13. 顶部前左

  14. 顶部前中心

  15. 顶部前右

  16. 顶部后左

  17. 顶部后中心

  18. 顶部后右

为了让生活更有趣,其他文件格式支持不同的通道映射。表 9-2 展示了某些常见音频文件格式及其 5.1 通道映射:

表 9-2. 常见音频文件格式的通道映射

文件格式 通道映射
WAV 前左,前右,中心,LFE,后左,后右
AC3 前左,中心,前右,后左,后右,LFE
DTS 中心,前左,前右,后左,后右,LFE
AAC 中心,前左,前右,后左,后右,低频效果声道(LFE)
AIFF 前左,后左,中心,前右,后右,低频效果声道(LFE)
FLAC 前左,前右,中心,低频效果声道(LFE),后左,后右
WMA 前左,前右,前中,低频效果声道(LFE),后左,后右

低频效果声道(LFE)通常被认为是低音炮声道。这并不完全正确,因为它与发送到低音炮端口的信号并不相同。它是一个用于携带 3 到 200 Hz 范围内声音的特殊声道,LFE 信号可以发送到任何能够处理它的扬声器。

对于 DVD 音频,使用 WAV 映射。(有关 DVD 音频的更多信息,请参阅第六章。)不必为 CD 设置环绕声,因为它们只支持双声道立体声。

在 Audacity 中创建多声道环绕音频时存在一些特殊问题。Audacity 在创建高质量立体声和单声道音轨方面非常出色,但其在管理多声道环绕方面的能力相当有限。您必须自己了解不同文件格式的正确通道映射,因为 Audacity 不会告诉您,并且当您将多声道音频文件导入 Audacity 时,即使文件是在 Audacity 中创建的,它也会丢失音轨名称和通道映射。

您可以在导出后通过在计算机上播放您的新音频文件来测试您的通道映射,如果您的计算机具有多声道环绕声卡,并且已经正确设置并正常工作。参见第十三章了解如何在 Linux 计算机上设置和测试环绕声播放。Windows 用户将在控制面板的“声音”模块中找到配置和测试工具,并且 Windows Media Player 支持环绕声。

测试您的新环绕声文件的另一种方法是将其烧录到 DVD 上,并在环绕高保真音响系统上播放。还有另一种方法是在为环绕高保真音响系统服务的数字音乐服务器上播放该文件。

第十章. 制作自己的铃声

无标题图片

我是个吝啬鬼,我认为为铃声付钱是愚蠢的。为什么我要付钱,当我已经拥有大量的 CD 和自己的录音音乐时?我甚至不喜欢手机。当我离家时,我不想被电子链束缚。如果我撞进沟里,最终会有人找到我,而且谁能说当我倒挂在扭曲的车辆中时能否接触到电话呢?偶尔不连接一下其实真的没关系。

但幸运的是,对于你们这些优秀的读者来说,这本书不仅仅是我喜欢的内容。手机用户喜欢拥有定制的铃声,并使用他们的手机作为音乐播放器(他们可以在公共场所大声播放这些低音质的扬声器,并让像我这样的坏脾气的人感到烦恼)。大多数移动服务提供商都将向客户收取他们手机上能做的每一件事的费用,包括铃声和文件传输。所以,你可能会对自己说,好吧,我就在网上搜索免费的铃声。小心——大多数所谓的“免费”网站都是付费服务的诱饵,有时还包含恶意软件。有一些合法的在线资源提供免费铃声;其中一些是平庸的业余作品,而有些则很好。在这个狂野的互联网时代,仔细购物并保持警惕。

由于这本书的目的是进行自己的音频制作,制作自己的铃声和适合手机的曲调能有多难呢?一点也不难。制作实际的音频文件很容易。难点在于确定你的手机支持哪些音频文件格式,然后如何将其中的文件传输进去。所以,让我们使用 Audacity 创建适合手机的音频文件,然后探讨不同的文件传输方式。你需要你的手机手册或任何你能找到的相关技术信息。如果你没有手册,请查看手机制造商的网站。

如果你需要复习 Audacity 使用的基础知识,请参阅第一章。

为手机定制音频

首先将你想要使用的音频文件导入 Audacity:要么打开一个现有的 Audacity 项目,要么点击文件 > 导入 > 音频以使用 WAV、FLAC、MP3、Ogg 或其他音频文件开始一个新的项目。保存为新项目,因为你将进行很多修改。

如果是一个立体声文件,首先使用轨道 > 立体声到单声道将其转换为单声道。当然,除非你的手机支持立体声。在编辑 > 首选项 > 导入/导出中,确保已勾选“始终将所有轨道混合为立体声或单声道”。

如果你需要创建特定长度的铃声,例如 20 到 30 秒,选择 20 秒或 30 秒的轨道部分来使用。这里有一个精确测量选择长度的技巧:将选择工具定位在剪辑的开始处。转到选择工具栏,选择“长度”单选按钮,确保“吸附到”未勾选,并输入你希望剪辑有多长时间。如果你用鼠标操作不够稳定,可以使用键盘上的箭头键移动光标。图 10-1 展示了如何使用这种方法创建一个精确的 20 秒剪辑。

在剪辑被选中时,选择编辑 > 修剪(或按 ctrl-T)来剪除多余的部分。进行任何其他你想要的编辑,例如修复问题、提升音量、应用特殊效果,或任何你想要的。一个不错的技巧是启动 Audacity 的均衡器来缩短音调曲线,因为你的手机扬声器的频率范围有限,这可以在其规格中找到。将音频文件均衡到与手机扬声器频率范围相匹配会使声音听起来更丰满,不那么刺耳。这也使得它在耳机和蓝牙耳机中听起来更好。

例如,假设你的手机扬声器频率范围是 500 到 10,000 Hz。相比之下,人类听觉的全频范围大约是 20 到 22,000 Hz。使用效果 > 均衡器将此范围之外的频率降低 24 dB。均衡器有两个控制组;你可以使用图形曲线或类似高保真均衡器的界面。选择“图形均衡器”以显示均衡器(图 10-2)。均衡器滑块的最大范围是 20 dB,而曲线的范围是 120 dB。降低-60 dB 的频率超出了我们能听到的范围,几乎等同于绝对静音。

使用选择工具栏创建精确时长(例如,20 秒)的剪辑

图 10-1. 使用选择工具栏创建精确时长(例如,20 秒)的剪辑

图形均衡器视图有用于控制频率的滑块。

图 10-2. 图形均衡器视图有用于控制频率的滑块。

在图 10-3 中,我通过点击 500 Hz 以上的线条创建一个控制点,点击 20 Hz 创建另一个控制点,然后将 20 Hz 的控制点向下拖动到-24。然后在另一端从 10,000 Hz 开始做同样的操作。要更改设置,请抓住并移动控制点,您可以在任何方向上移动它们。渐变的曲线听起来比突然的过渡更好。

这里显示了均衡器的绘制曲线视图,展示了一条匹配电话扬声器频率响应的曲线

图 10-3。这里显示了均衡器的绘制曲线视图,展示了一条匹配电话扬声器频率响应的曲线。

您可以垂直和水平放大均衡器窗口;使其变宽可以显示更多的频率刻度。左侧的滑块增加或减少分贝刻度的大小。均衡器没有撤销功能,但如果您无法挽回错误,可以点击“平坦”按钮将其重置为零。通过将控制点拖离图表来移除控制点。

您可以通过超过零来增加振幅,因为这与我们在 Audacity 中录音或播放时使用的零分贝满量程的零不同。它不标记剪辑发生的点。相反,均衡器中超过零的任何内容只是振幅的增加,而低于零的任何内容是振幅的减少。您仍然可能造成剪辑或使声音太响,因此预览按钮可以帮助您。默认情况下,预览按钮将预览剪辑的前三秒。您可以在编辑 > 首选项 > 播放对话框中更改此持续时间。

您可以使用“另存为”按钮保存您自定义的铃声均衡器曲线,然后您可以将其应用于所有铃声。

当您处于绘制曲线视图时,“线性频率刻度”复选框将刻度从默认的对数视图更改为线性。当您想更详细地查看低频时,请使用对数视图。

滤波器设置长度控制 Audacity 一次处理多少个样本。默认值为 4,001,大多数情况下应该足够。您可以通过移动鼠标滑块或使用键盘上的箭头键来调整此设置。Audacity 显示一条跟随均衡曲线蓝色线的绿色线是正常的。这显示了 Audacity 实际使用的曲线,它受到均衡算法限制的影响。如果绿色线和蓝色线差异很大,请增加滤波器设置长度或平滑曲线以使过渡更平缓。

当你完成编辑后,你的铃声就准备好导出了,你需要知道你的手机需要什么文件格式和规格。例如,假设你的手机需要 192Kbps 恒定比特率 MP3,采样率为 8,000 Hz。没问题。如果你的项目采样率尚未为 8 kHz,请点击轨道 > 重采样将其重采样到正确的速率。然后打开文件 > 导出 > MP3 文件 > 选项对话框。选择比特率模式:恒定和品质:192Kbps (图 10-4)。

导出到手机所需的 MP3 格式和质量级别

图 10-4. 导出到手机所需的 MP3 格式和质量级别

对于支持 WAV 文件的新款手机,要求范围从 8 比特深度 8 kHz 采样率到 16/44.1。如果你需要更改采样率,请在导出之前通过使用轨道 > 重采样对话框进行更改。然后使用文件 > 导出 > 其他未压缩文件 > WAV对话框并选择适当的比特深度导出。图 10-5 显示了导出到 8 比特 WAV 的样子。

记住,在导出之前进行重采样,并在导出时设置比特深度。如果你的手机规格指定了比特率,比如 64Kbps,怎么办?比特率总是比特深度乘以采样率乘以通道数,所以 8 比特深度乘以 8 kHz 采样率乘以 1 个通道等于 64Kbps 的比特率。然而,理想情况下,你的手机说明书不会让你做数学题,而是会为你全部列出。

导出到 8 比特 WAV

图 10-5. 导出到 8 比特 WAV

请记住你手机上可用的存储空间以及你试图将其塞入低保真播放设备中的高保真音质值。如果你有不同质量级别的选择,尝试使用较低质量设置以找到质量和存储容量之间的良好平衡可能是有益的。

应用动态范围压缩

小型手机扬声器无法处理很大的动态范围,因此你应该压缩音频文件的动态范围以平衡音量变化。我更喜欢使用效果 > 均衡器,因为它降低了响度较高的频率的增益,并提高了响度较低的频率的增益。均衡器效果往往比较刺耳,但在小型移动设备扬声器上听起来相当不错。图 10-6 展示了我喜欢使用的设置:高压缩级别和低噪声阈值。噪声阈值决定了它将改变哪些频率,所以-80 dB 意味着几乎一切,而-20 dB 则影响-20 dB 及以上的频率。

应用均衡器效果后,你可能需要将音轨归一化以提高音量至尽可能高的水平。选择效果 > 归一化,勾选“移除任何直流偏移”,勾选“归一化最大幅度到”,并将分贝值设置为零,这是你能达到的最高值。图 10-7 展示了第一半部分均衡化和归一化,而第二半部分未做处理。

严格来说,均衡器效果并不真正像压缩器那样工作,更像是一个限制器。限制器就像是一个设置为高比率(如 20:1 及以上)的压缩器,所以它不是平滑地降低超过阈值增益,而是最坚定地将其压缩。

效果 > 均衡器的建议设置用于压缩动态范围

图 10-6. 效果 > 均衡器的建议设置用于压缩动态范围

波形的前半部分已经应用了均衡器和归一化效果。看看高点和低点是否比波形后半部分更均匀。

图 10-7. 波形的前半部分已经应用了均衡器和归一化效果。看看高点和低点是否比波形后半部分更均匀。

手机音频文件格式

普通音频文件格式并不奇怪;大多数手机还支持一种特殊的铃声格式,称为铃声文本传输语言(RTTTL)。现代手机还支持 MIDI、MP3、WAV 以及许多其他音频文件格式。Audacity 不支持 RTTTL 或 MIDI,但你可以用它来准备音频剪辑,以便在其他软件中进行 RTTTL 或 MIDI 转换。第三章,第七章,第十一章和第十二章讲述了如何清理音频文件、使用不同的音频格式和质量级别以及特殊效果。

RTTTL

RTTTL 是诺基亚发明的一种文本语言,用于描述铃声,旨在成为通用手机铃声语言的简单铃声传输。以下是其书面形式的样子:

AbbaDance:d=4,o=5,b=80:32p,2d,8c.,2d#,32d.,16c.,32a#.4,8c.,8d.,2d.

这就是 ABBA 的“Dancing Queen”。不,真的。你可以像下载其他音频文件一样下载 RTTTL 铃声,或者如果你手机上有铃声创作器,你也可以用手机键盘输入它们。它可能被称为 旋律制作器 或类似的东西。你的手机手册会告诉你使用哪些按键来输入 RTTTL 字符。AbbaDance 示例显示了三个必需的元素:名称、默认值和数据。

名称 字段是歌曲名称,它不能超过 10 个字符或包含冒号,因为冒号标志着名称字符串的结束。

默认值 字段定义了默认时值、八度和速度:

d 时值
o 八度
b 速度

任何没有分配其自身时值的音符将使用默认时值。例如,AbbaQueen 中的 d=4 表示默认时值是四分音符。范围有四个八度,编号从 4 到 7。速度设置每分钟的节拍数。

RTTTL 描述了音乐音符的标准时值:

1 全音符
2 二分音符
4 四分音符
8 八分音符
16 十六分音符
32 三十二分音符
. 一个点等于半拍

你可以得到全音符和升音,但没有降音,因为键盘上没有降音符号。但是没关系,因为升音和降音是重叠的——例如,G-sharp 和 A-flat 是同一件事。

P 暂停
A A
A# A-sharp 和 B-flat
B B
C C
C# C-sharp 和 D-flat
D D
D# D-sharp 和 E-flat
E E
F F
F# F-sharp 和 G-flat
G G
G# G-sharp 和 A-flat

如果你真的想深入研究 RTTTL,你可以在网上找到规范;只需发挥你强大的“RTTTL 规范”网络搜索能力即可。有许多网站提供可下载的 RTTTL 铃声,供您直接使用。

专有音频文件格式

如果你的手机需要 Audacity 原生不支持的自有或非标准音频文件格式,或者你更喜欢使用 AAC、WMA 或其他格式,你可以首先使用 Audacity 创建和编辑你的音频剪辑,将它们导出为 WAV 格式,然后使用文件转换应用程序将 WAV 转换为正确的格式。你在哪里找到转换器?有成千上万种,你只需进行一点网络搜索就可以找到。

另一个选择是安装开源的 FFmpeg 编码器。这是一个高质量的开源多媒体编码器,Audacity 内置了 FFmpeg 集成。FFmpeg 是免费软件,且无需付费。访问 FFmpeg 文档页面(www.ffmpeg.org/documentation.html)了解如何在 Mac 和 Windows 上下载和安装它。Linux 用户可以从他们的软件仓库中安装它。

高级音频编码(AAC)音频格式是一种有损压缩和压缩技术,它包含数字音频和视频,作为 MPEG-2 和 MPEG-4 规范的一部分。AAC 音频应该比 MP3 听起来更好,MP3 也是一种有损压缩格式。AAC 是受专利保护的,任何想要分发 AAC 编码内容的人都可以自由地这样做,不受限制或支付费用。但开发和使用 AAC 编解码器需要专利许可。

AAC 是 iTunes 的默认音频容器格式,尽管 iTunes 也支持 WAV、MP3、AIFF 和 Apple Lossless。AAC 有一些 MP3 没有的能力,例如支持多达 48 个声道,而 MP3 只支持 2 个声道,采样频率范围更广,8 kHz 到 96 kHz,而 MP3 只支持 16 kHz 到 48 kHz。据说 AAC 处理高频和立体声图像的能力更好。还有一些其他对编解码器设计者更有趣的差异;但最终,就像往常一样,关键在于它对你来说听起来如何。

注意

弗劳恩霍夫协会(Fraunhofer-Gesellschaft),MP3 的原始开发者之一,也是其众多专利持有者之一,还拥有 5.1 环绕声 MP3 编码器和解码器。正如大多数人听说这个时所说,“为什么还要费心去处理糟糕的六声道环绕声呢?两个糟糕的六声道就足够了。”但对于那些感兴趣的人来说,它可以在 Mac 或 Windows 上免费评估。如果你喜欢它,并想用于除了个人评估以外的任何用途,那么它将需要付费。

AAC 由许多文件扩展名表示—.m4a, .m4b, .m4p, .m4v, .m4r, .3gp, .mp4, 和 .aac—这些扩展名包括视频和音频。Audacity 使用.m4a扩展名,这是苹果用来表示非复制保护音频文件的。.m4p是用于加密、复制保护 iTunes 音频文件的扩展名。

在 Audacity 中将文件保存为 AAC 格式很简单,一旦安装了 FFmpeg:点击导出 > M4A (AAC) 文件 (FFmpeg) > 选项。在选项对话框中,您有一系列从 10 到 500 的质量设置,其中 500 是最高质量。这个范围代表公平、不错、好、更好和最佳。对于更复杂的录音,256 是一个不错的设置。简单的录音,如语音作品,在 50 时听起来还可以,但 100 时明显更好(图 10-8)。

导出为 AAC 格式(默认 iTunes 格式),创建一个*.m4a*扩展名的文件

图 10-8. 导出为 AAC 格式(默认 iTunes 格式),创建一个.m4a扩展名的文件

WMA 是 Windows Media Audio,是微软发明的一种专有、无损音频压缩技术。WMA 既指编解码器也指音频文件格式。WMA 支持最大 48 kHz 采样率和两个通道。WMA 音频通常封装在高级系统格式(ASF)容器中,其中包含歌曲名称、艺术家名称和曲目编号等元数据。ASF 还支持 Windows Media DRM(数字版权管理)。DRM 和非 DRM WMA 文件的文件扩展名相同,.wma;如果您尝试在不支持 Windows DRM 的播放器上播放 DRM 文件,它将将其标记为不可播放。

在 Audacity 中,打开导出 > WMA (版本 2) 文件 (FFmpeg) > 选项对话框。您唯一的选择是选择比特率(图 10-9)。

如何将文件传输到您的手机

大多数美国服务提供商希望您做的是注册他们的在线服务,并从他们那里购买所有铃声和音乐。如果您只想拥有一部手机,而不是一个屏幕很小的网络浏览器/电子邮件客户端怎么办?那么您可以通过短信订购新的铃声。如果您不想为短信服务付费或学习用拇指打字怎么办?那么您可能就是某种怪人。自豪地佩戴这个标签,让我们探索其他将文件移动到手机和从手机中移出的方法。我最喜欢的方法是从 PC——我的 PC,即我控制并且不需要付费才能访问的 PC。

许多手机接受 SD 存储卡,通常是 miniSD 或 microSD 卡。不到 20 美元,您就可以通过 USB SD 卡读卡器或标准 SD 卡读卡器的适配器获得这些卡,这样您就可以将其插入电脑的标准 USB 端口。这些卡具有几个 GB 的存储容量。

将铃声编码为 WMA 格式

图 10-9. 将铃声编码为 WMA 格式

注意

第一次在你的手机中安装新的 SD 卡时,你应该使用手机的菜单进行格式化。这为你的手机创建正确的文件系统。你的手机手册会告诉你如何操作。格式化存储卡会删除其上的所有内容。

格式化卡后,只需将其插入适当的卡读卡器,插入电脑,复制你的新铃声,然后将卡放入手机并将文件传输到正确的目录。你的手机甚至可能有一些有用的菜单选项来简化这个过程。

蓝牙是连接手机到电脑的另一种常见选项。这个功能有一个奇怪的名字:非常短距离的无线无线电网络,从 1 到 100 英尺。如果你的电脑没有蓝牙适配器,你可以花不到 30 美元买一个 USB 蓝牙适配器。选择蓝牙 2.0,因为这是最新最快的标准。要建立蓝牙网络连接,请遵循相机手册中的说明。通常,你会在电脑上激活蓝牙,将其设置为发现模式,然后从手机菜单中设置与手机的配对。如果它要求你输入个人识别号码(PIN),这通常是一个你在发现时随机生成的数字,然后你在电脑上重复该数字以完成连接。

一些手机服务提供商禁用通过蓝牙进行文件传输,因为他们想让你为在线服务支付更多费用,或者提前额外收取数据连接套件的费用,这是一种说法,意思是他们想让你为解除手机一些内置功能的功能付费。图 10-10 展示了一张 microSD 卡、一个 USB 蓝牙适配器和配件。

当然,你可以通过购买未锁定的手机来避免支付解锁手机功能的费用。你必须自己决定是选择由服务提供商补贴的品牌手机,这会锁定你一两年,还是支付全价以获得未锁定手机的自由。

一张 microSD 闪存卡适配器,一个小巧的 Cirago USB 蓝牙接口,另一个适配器,一个可爱的红色 USB microSD 读取器,一张微型 2GB microSD 卡,以及一枚美国 25 分硬币作为参考

图 10-10. 一张 microSD 闪存卡适配器,一个小巧的 Cirago USB 蓝牙接口,另一个适配器,一个可爱的红色 USB microSD 读取器,一张微型 2GB microSD 卡,以及一枚美国 25 分硬币作为参考

我认为在电脑和手机之间传输文件最简单、最好的方式是通过普通的 USB 线缆,并且一些手机支持这种方式。

这些方法中的任何一种都可以用于任何类型的文件传输,而不仅仅是你的铃声。照片、联系人、消息,你手机中存储的任何数据都可以备份到电脑上,或者从电脑传输到你的手机上。有许多 Windows 和 Apple 软件应用程序可以从电脑管理你的手机,这些应用程序通常需要花费几美元。有一个值得尝试的优秀的开源免费应用程序,它可以在 Linux、Mac 和 Windows 上运行:BitPim。引用 BitPim 网站(www.bitpim.org/)的话:

BitPim 是一个程序,允许你查看和操作许多 CDMA 手机上的数据。这包括电话簿、日历、壁纸、铃声(功能因手机而异)和文件系统。

现在你已经知道了如何创建和优化你自己的定制铃声和音频文件,以及如何为你的移动设备添加额外存储空间,这样你就可以随身携带你的整个音乐收藏。别忘了耳机。甚至是一些时尚的高端耳塞式耳机,因为你的手机扬声器可能不太好,但它的声音处理器可能相当不错,只需要一些好的耳机就能发挥出它的潜力。

第十一章。Audacity 特殊效果插件

无标题图片

插件是附加的软件模块,为 Audacity 提供额外的功能:过滤器、分析、音调生成器和各种特殊效果。插件很棒,因为你不需要安装一个包含世界上所有功能的庞大程序,只是为了获得你真正想要的几个额外功能。

一些是随 Audacity 安装捆绑的,你可以在互联网上找到更多。或者你也可以自己编写。插件不是独立运行的;它们在宿主上运行,宿主是支持插件的程序(如 Audacity 和其他音频制作软件)。你将在生成、效果和分析菜单中找到 Audacity 的插件。

有三种类型的插件与 Audacity 一起工作:Linux Audio Developer’s Simple Plugin API (LADSPA)、Virtual Studio Technology (VST)和 Nyquist。LADSPA 主要用于 Linux,尽管有一些 LADSPA 插件适用于 Windows 和 Mac。VST 适用于 Windows 和 Mac,Nyquist 插件在所有三个平台上都适用。

插件在 Audacity 菜单中按字母顺序排序;没有方法可以按你的意愿排序或组织插件,例如你最常用的那些。找到关于它们的有用信息,比如它们的功能或各种设置的含义,通常是一个小小的挑战。Audacity 维基上有一些信息,各种插件项目的首页有不同程度的有用文档。尝试它们并亲自听听它们的功能很容易。在本章中,我们将详细介绍一些常用插件,并定义一些术语。本章末尾的简明音频术语表解释了你将遇到的关于插件和特殊效果的更多常见术语。

数字和音频信号的处理和分析是信号处理学科的一部分。我们不会在本书中深入探讨信号处理的数学和理论;要了解更多信息,请参阅参考文献部分。

让我们直接深入探索和尝试 Audacity 的一些特殊效果。你的 Audacity 菜单可能与你使用的示例不同,这取决于你使用的 Audacity 版本和安装的插件。如果你不知道如何查找和安装插件,请跳到本章关于在 Linux 和 Windows 上查找和安装插件的章节。

注意

当你找不到文档时,有时浏览源代码会给你带来有用的信息。你可以在audacity.cvs.sourceforge.net/viewvc/audacity/audacity-src/在线查看 Audacity 的所有源代码。使用“粘性标签”菜单选择正确的 Audacity 版本,然后查看nyquist, plug-inssrc/effects目录以查看 Audacity 插件的源代码。

混音

我们的第一个效果甚至不是真正的 Audacity 特殊效果:混音。混音是指一个轨道淡出,另一个轨道以某种重叠的方式淡入。我们在广播和电视上经常听到这种效果。Audacity 没有混音功能,但使用时间移动工具创建混音非常简单。

您需要两个轨道来完成这个操作。对一个轨道应用效果 > 淡出,对另一个轨道应用效果 > 淡入。然后使用时间移动工具移动轨道以创建所需的重叠程度(图 11-1).

使用淡入/淡出效果和时间移动工具创建的简单混音

图 11-1. 使用淡入/淡出效果和时间移动工具创建的简单混音

为了更精细地控制淡入淡出的程度和持续时间,请使用包络工具。

生成菜单

生成菜单包含创建新音调的插件。从一个新的、空白的 Audacity 会话开始。选择生成,然后选择您想要尝试的任何效果。这将打开一个对话框,显示特定音调的可用选项。如果选中了现有轨道中的所有音频,生成新音调将替换旧的一个。如果选中了现有音频的一部分,则该选择将被替换。如果没有选中现有轨道,则创建新音调也会创建一个新轨道。您还可以选择轨道 > 添加新轨道 > 音频轨道来创建额外的轨道。

正弦波示例

让我们创建一个正弦波来熟悉创建音调的过程。打开生成 > 音调对话框。选择正弦波形,将频率(Hz)设置为 3,999,将振幅设置为 0.8,并设置您想要的持续时间。默认为 30 秒(图 11-2).

您将看到类似图 11-2 的内容。放大查看经典的正弦波形(图 11-3).

3,999 Hz 正弦波可能的样子

图 11-2. 3,999 Hz 正弦波可能的样子

极端放大下的 3,999 Hz 正弦波

图 11-3. 极端放大下的 3,999 Hz 正弦波

点击播放按钮来欣赏您的新正弦波音调。

生成音调的频率范围

你新生成的音调的可选频率范围理论上是你项目采样率的一半。例如,如果你的项目频率是 8,000 Hz,那么你的音调可选范围应该是 0 到 3,999 Hz。但你的可用范围略小。当你看到的是静音或脉冲波形而不是漂亮的稳定波形时,你就知道你处于范围的极限端。图 11-4 图 展示了使用 8,000 Hz、16,000 Hz 和 32,000 Hz 采样率(从上到下)创建的 3,999 Hz 正弦波。图 11-5 展示了当你放大查看时它们的外观以及它们在更高采样率下看起来更加平滑。

在三个不同的项目采样率下,3,999 Hz 正弦波的外观

图 11-4. 在三个不同的项目采样率下,3,999 Hz 正弦波的外观

这显示了在更高的采样率下波形如何平滑。

图 11-5. 这显示了在更高的采样率下波形如何平滑。

DTMF 音调

使用 生成 > DTMF 音调 效果很有趣,因为你可以用它来播放任何单词或文本字符串的 DTMF 音调。你可能会问,什么是 DTMF 音调?那些是由模拟按键电话发出的音调:双音多频。它被称为双音,因为每个按键发送的音调是两个音调的组合。这张方便的表格来自 图 11-6),从维基百科(经许可)中摘取,显示了按键电话的音调矩阵。

图 11-7 展示了 DTMF 音调发生器对话框。DTMF 序列是一个单词、短语或任何字母数字字符串。音调/静音比控制每个音调之间空间的持续时间。

模拟电话音调是每个按键的两个音调组合。 (图片由维基百科提供,根据创意共享署名-相同方式共享许可。)

图 11-6. 模拟电话音调是每个按键的两个音调组合。 (图片由维基百科提供,根据创意共享署名-相同方式共享许可。)

DTMF 音调发生器播放任何单词或短语。

图 11-7. DTMF 音调发生器播放任何单词或短语。

图 11-8 显示了“carla”在 DTMF 中的样子。

DTMF 波形拼写“carla”

图 11-8. DTMF 波形拼写“carla”

振荡

生成 > 振荡 效果是另一个有趣的音调生成器。使用这个功能可以生成听起来像滑哨声的音调。选择一个低频和一个高频以及持续时间,音调将根据频率顺序上下滑动。你可以尝试不同的波形类型来听它们的声音:正弦波、方波(别名或无别名)、或锯齿波。插值设置提供线性或对数两种选项。线性为所有频率提供相等的时间,而对数则让低频播放更长时间(图 11-9).

振荡音听起来像滑哨声。

图 11-9. 振荡音听起来像滑哨声。

生成噪声

生成 > 噪声有三个选项:噪声类型、幅度和持续时间。

图 11-10. 生成 > 噪声有三个选项:噪声类型、幅度和持续时间。

生成 > 噪声 菜单项用于生成白色、粉红色或棕色噪声。你可能会问,为什么要这样做呢?我远远没有足够的知识去深入数学,而数学是声学的基础,如果你有兴趣学习,那是非常迷人的。我可以回答“为什么”:用于测试音频设备,配置音乐厅中的声音平衡,创建背景噪声以帮助睡眠或集中注意力,以及掩盖令人烦恼的声音。图 11-10 显示了 Audacity 的简单噪声生成器。

白噪声常用于电子音乐制作,因为它具有穿透其他噪声的有用特性。它被称为白噪声,因为它与白光类似,白光是所有光频率的等量组合。白噪声是所有可听音频频率的组合,所以可以这样理解:20,000 个音调同时以相同的幅度播放。然而,这并不完全准确,因为它通常是由随机噪声发生器生成的,其中所有频率都是等可能的,而不是同时播放。人耳对高频更敏感,所以尽管所有频率的幅度相同,但我们更注意高频。白噪声听起来像蒸汽嘶嘶声。

粉红噪声听起来与白噪声相似,但不同频率的振幅并不相同,随着频率的升高,它以每八度 3 分贝的速度下降,每个八度都有相同的振幅。因此,低频比高频有更多的能量,粉红噪声听起来更像咆哮而不是嘶嘶声。

布朗噪声也被称为红噪声。它被称为布朗噪声是因为布朗运动,而不是颜色,如果你对此感兴趣,我将把它留作你的家庭作业去发现原因。(更多数学。)随着频率的增加,布朗噪声的振幅以每八度 6 分贝的速度减小,因此它比粉红噪声有更多的低音强调。粉红噪声和布朗噪声在频率范围内感知振幅的方式比白噪声更接近人耳。

图 11-11 显示了在 Audacity 中白噪声、粉红噪声和布朗噪声的外观。底部三个轨道在频谱视图中,这为你提供了不同频率相对能量(振幅)的清晰图像。红色代表“更热”,即更高的振幅,蓝色代表“更冷”,即较低的振幅。这就像光谱一样,光谱的红色端更热,蓝色更冷。如果图像是彩色的,你会看到白噪声频谱是均匀的,粉红噪声频谱从红色到带有蓝色的红色,从红色到蓝色的范围在布朗噪声频谱图中更为明显。当然,你可以在 Audacity 中轻松创建这些并看到颜色。

图 11-11。前三个轨道显示了线性波形中的白噪声、粉红噪声和布朗噪声。第二组三个轨道显示了它们的频谱视图。

图 11-11。前三个轨道显示了线性波形中的白噪声、粉红噪声和布朗噪声。第二组三个轨道显示了它们的频谱视图。

Audacity 不支持几种其他类型的“噪声颜色”,除非你找到或编写一个插件。紫色噪声是布朗噪声的对立面,因为振幅随着频率的增加以每八度 6 分贝的速度增加。蓝色噪声是粉红噪声的对立面:振幅以每八度 3 分贝的速度增加。

我们在这本书中多次使用了生成 > 静音。它创建了一个完全静音的间隔,持续时间为你想要的任何长度。这对于对齐略微错位的轨道、平衡两位演讲者的播客间距,以及确保歌曲之间的间隔绝对安静非常有用。它还有助于测试你的播放系统实际上有多安静。

测试音调

选择生成 > 音调是一种测试你便宜(或好)声卡极限和给自己进行即兴听力测试的有趣方式。你可以使用正弦方形锯齿波方形,无混叠波形来创建音调。放大到极致,以查看像在关于波形的书籍和文章中看到的那样查看波形(图 11-12)。

正方形、锯齿波和正弦波

图 11-12. 正方形、锯齿波和正弦波

可以将正弦波视为没有谐波的单纯音调,所以当你想要一个纯净的音调时,你想要一个正弦波。正弦波平滑地从正值(高于中值,或零线)变为负值(低于中值线)然后再回到正值。更复杂的音调可以通过正弦波的组合来表示。正弦波无处不在:海浪、Slinky、交流电和光波只是几个例子。在音频中,正弦波代表频率,以赫兹(每秒周期数)衡量,幅度(响度或音量),和相位。图 11-13 显示了在 Audacity 中它们看起来是什么样子。

你可以将相位理解为 Audacity 的时间移动工具;当相位不为零时,这意味着波形在时间上被向前或向后移动。负值表示向后移动,正值表示向前移动。这被称为线性相位,因为所有频率都受到同等影响。有时我们不会注意到线性相位的变化,因为没有东西可以与之比较。一个例子是播放 CD——音乐在通过数字到音频转换器时会有轻微的延迟,但我们并不在意,因为我们没有注意到。另一方面,这对于叠加录音来说是一个真正的问题,因为新轨道将与旧轨道不同步,因此我们必须对此进行补偿。(参见第九章了解更多关于叠加录音和同步的信息。)

两个相对于彼此故意相位偏移的波形将创造出新的声音。一个常见的效果是通过复制音频轨道并稍微使两个轨道不同步来创建令人愉悦的回声。现在你知道了过度制作商业人声的秘密:他们使用了过多的相位偏移层。(如果你喜欢回声,尝试选择效果 > 回声。)

顶部轨迹是 100 Hz 的正弦波,第二轨迹是 1,000 Hz,展示了不同频率的形状。两者具有相同的振幅。第三轨迹是顶部两个轨迹振幅的一半,第四轨迹是第三轨迹的一个轻微相位偏移的副本。

图 11-13. 顶部轨迹是 100 Hz 的正弦波,第二轨迹是 1,000 Hz,展示了不同频率的形状。两者具有相同的振幅。第三轨迹是顶部两个轨迹振幅的一半,第四轨迹是第三轨迹的一个轻微相位偏移的副本。

相位偏移也描述了两个或更多波形之间的同步。两个完全同相的波形会组合振幅,听起来更响亮。两个波形在相位上有所不同的组合会产生各种不同的声音。两个相对于彼此倒置 180 度的相同波形会相互抵消。降噪设备就是通过不同程度的这种方式来实现这一点的。

方波波形与数字电子有关。(方波有时也被称为 Rademacher 函数。)与漂亮的平滑曲线的模拟正弦波不同,方波表示数字电路的瞬间转换。就像所有数字一样,它完全是二进制的——一或零,开或关。与代表没有谐波的纯音的正弦波不同,方波充满了谐波。当你在 Audacity 中创建正弦波和方波并在它们之间进行比较时,你可以听到明显的区别。方波只包含奇数整数谐波,如第一、第三和第五谐波。

一个方波,无混叠波形是数字音频中混叠引起的失真的绝佳演示。将相同频率和持续时间的方波和(无混叠)方波并排放置并放大。你会看到类似图 11-14 的东西,当你听它们时,应该有一个可听见的差异,无混叠的波形听起来更平滑、更纯净。这也是体验不同采样率效果的好方法;你会注意到较低的采样率有更高的失真。

顶部波形是混叠的,而底部波形则不是。

图 11-14. 顶部波形是混叠的,底部波形则不是。

锯齿波波形既有偶次谐波也有奇次谐波,因此它被用于合成复杂的音乐声音,如弦乐器。

点击轨迹

点击音轨效果是一个有用的插件,可能不会随 Audacity 默认安装一起提供(有关查找和安装更多插件的信息,请参阅本章末尾的 Linux 插件和 Windows 插件)。它适用于 Linux、Mac 和 Windows。点击音轨类似于节拍器音轨,有一个区别:每个小节的第一个节拍是强调的(图 11-15

图 11-15. 点击音轨效果在可配置的速度、持续时间和音调品质下创建节拍音轨。

不同的点击类型有 pingnoisetick。噪声点击共振设置使它们听起来更清晰或更糊,数值越高越清晰。

点击音轨使用两种不同的默认音调:中音 C 以上的 C 音对于每个小节的第一个节拍,由 MIDI 数字 72 表示,以及中音 C 对于每个小节剩余的节拍,由 MIDI 数字 60 表示。例如,如果你选择华尔兹节奏,每个小节有三拍,你会听到“TICK tick tick TICK tick tick”。每个八度有 12 个音符,包括降调和升调。图 11-16 是一个方便的表格,列出了所有 MIDI 音符数字。

选择点击音轨 MIDI 音高的便捷 MIDI 音符表

图 11-16. 选择点击音轨 MIDI 音高的便捷 MIDI 音符表

为了好玩,唱一下《音乐之声》中的“Do Re Mi”歌曲来刷新你对七个全音符的记忆——do、re、mi、fa、so、la、ti、do。(如果你忘记了,这涵盖了从 A 到 A 的一整个八度加上一个音符:A、B、C、D、E、F、G、A。)

拨弦

另一个有趣的附加插件是拨弦。它相当简单:选择你的 MIDI 音符,设置持续时间,并配置渐变或突然消失。96 这个高音符听起来像老式幻灯片放映中的滑动前进音调。(20 世纪 60 年代的学校,在上个千年之前……)低频音符听起来像科幻音效(图 11-17

图 11-17. 拨弦效应产生不同频率的音调,具有短或长渐变消失。

Risset 鼓

Risset 鼓效果产生了一种很好的音调,在低频时听起来像深沉的低音鼓,或者任何有丰满音色的大型共鸣鼓,而在高频时听起来像牛铃或三角铁(图 11-18)。

Risset 鼓效果

图 11-18. Risset 鼓效果

Risset 鼓效果是以发明者 Jean-Claude Risset 命名的,Jean-Claude,他使用电子音频创造了许多惊人的效果。一个 Risset 模式创造出一种节奏倒置的错觉:当节奏实际上在减少时,它听起来像是在增加,反之亦然。Risset 节奏给人一种节奏始终在加速,即使它保持相同的错觉。

这是一个用于创建 2/4 或 4/4 打击乐节奏的好效果。我在图 11-18 中使用的设置在每秒两个节拍处创建了一个深沉、轰鸣的低音鼓点。衰减值设置节拍的长度,因此 0.5 表示每秒两个节拍。这只会产生一个节拍,所以你可以通过点击 shift-Play 预览一个稳定重复的节拍听起来会怎样。当你觉得足够时,点击停止按钮。当你准备好创建鼓点轨时,选择节拍然后点击效果 > 重复来创建循环。这会打开一个对话框,其中有一个选项:你想让它重复多少次。它甚至为你做算术,并告诉你它会运行多长时间(图 11-19)。

图 11-20 显示了你的新鼓轨将看起来是什么样子。

使用重复效果循环 Risset 鼓点以创建鼓轨

图 11-19. 使用重复效果循环 Risset 鼓点以创建鼓轨

使用 Risset 鼓和重复效果创建的鼓轨

图 11-20. 使用 Risset 鼓和重复效果创建的鼓轨

如果你创建的节奏不太准确怎么办?使用“改变节奏”效果很容易解决这个问题,它可以在不改变音高的情况下改变节奏。首先撤销重复效果,这样你就可以回到原始的单个鼓点。然后点击“效果”>“改变节奏”并输入你的新每分钟节拍值。在图 11-21 中,它从每分钟 120 个节拍变为 150 个。但当然它仍然只是一个节拍,所以回到“效果”>“重复”并再次创建一个循环,这就是你的新、更快的鼓点音轨。

使用“改变节奏”效果在不改变音高的情况下改变节奏。

图 11-21。使用“改变节奏”效果在不改变音高的情况下改变节奏。

最好改变你原始的单个节拍的节奏,因为将“改变节奏”效果应用于整个循环音轨将改变每个节拍开始的位置,大多数节拍都会偏离节奏。尽管这可能会很有趣,但使用与否取决于你。

效果菜单

“效果”菜单中的效果不会创建新的音调,而是修改现有的音调。掌握“效果”菜单插件的一个好方法是将其应用于在“生成”菜单中创建的音调。正弦波非常适合进行效果实验,因为它是一个简单的音调,你可以清楚地听到效果的作用。另一个好的测试音调是你自己的说话或唱歌声音的简单录音。

注意

注意“效果”菜单顶部的“重复最后一个效果”(ctrl-R)命令。这是一个快速重新应用相同效果并保持相同设置的方法。

混响

在音频编辑中,最流行的效果可能是混响。你可能听过商业音乐录音,其中混响太浓,听起来像歌手被层层混响压垮,或者像录音是在一个空游泳池中制作的。一点混响就能走得很远。混响的通常目的是更好地模拟现场声音,但当然你可以做任何你喜欢的事情。混响可以听起来空灵而遥远,并能唤起半遗忘的事物。

Audacity 的 Gverb 插件是跨平台的,并有一个预览按钮,因此你可以轻松尝试不同的设置。你应该在监听扬声器上预览混响设置,而不是耳机,因为耳机中的通道分离会减弱混响效果。

注意

Audacity 的默认预览时间是三秒;你可以在“编辑”>“首选项”>“播放”对话框中更改此设置。

有几种方法可以将混响应用到你的音频轨道上。一种常见的技术是从一个副本湿轨道而不是原始未修改的干轨道开始工作。当你对混响调整满意后,将湿轨道与干轨道的副本混合。保留一个原始的 100%干轨道意味着你可以制作具有不同设置的多个混响轨道,并在混音中控制最终结果。

你也可以只编辑一个副本轨道,保留原始轨道以备不时之需。如果你大胆,可以无保护地工作在原始轨道上。Audacity 有几乎无限的撤销功能,所以这并不那么大胆,但坏事情可能会发生,然后你需要额外的工作。

首先选择音频的一部分或整个轨道。要从 Gverb 的中性状态开始,将所有滑块推到最左边(图 11-22

图 11-22. Gverb 所有设置在中性,或无混响

现在你可以尝试设置并听听它们的效果。最明显的变化来自早期反射级和干信号级设置。接下来尝试调整尾音级,保持其值与早期反射级相等或更小,然后尝试改变混响时间。以下是每个设置的作用:

房间大小

这应该模拟不同的房间大小(以平方米为单位),它主要作用于早期反射和尾音级。对我来说,它似乎没有做什么;你的体验可能会有所不同。其他混响插件和设备似乎做得更好。

混响时间

这控制着混响的持续时间(以秒为单位),较大的值表示更长的持续时间。

阻尼

阻尼值越高,混响的强度越低。这模拟了不同的房间大小和表面,如硬表面的小型房间产生明亮的声音,或具有吸音表面的大型房间产生柔和、昏暗的效果。

输入带宽

这是一个音调控制,较高的值强调高频,听起来更明亮。

干信号电平

这控制着原始信号被改变的程度;0 表示没有改变,-70 表示全部改变。然而,即使在零的情况下,你仍然会听到一些变化。整体音量随着干信号电平的降低而降低,因此你可能需要在应用混响后应用归一化。

早期反射级

这模拟了声音在墙壁和家具上的反射。早期反射总是比干信号延迟。

尾音级

这控制着混响的强度。如果你将这个值设置得比早期反射级值大,会得到一个有趣的空间感,就像你正在音乐厅外聆听一样。

Audacity 手册建议尝试一些预制设置(wiki.audacityteam.org/index.php?title=GVerb),我已在此处复制:

  • 快速修复

    房间大小:40 m²

    混响时间:4 s

    阻尼:0.9

    输入带宽:0.75

    干信号级别:0 dB

    早期反射级别:-22 dB

    尾部级别:-28 dB

  • 明亮,小大厅

    房间大小:50 m²

    混响时间:1.5 s

    阻尼:0.1

    输入带宽:0.75

    干信号级别:-1.5 dB

    早期反射级别:-10 dB

    尾部级别:-20 dB

  • 漂亮的大厅效应

    房间大小:40 m²

    混响时间:20 s

    阻尼:0.50

    输入带宽:0.75

    干信号级别:0 dB

    早期反射级别:-10 dB

    尾部级别:-30 dB

  • 在下水道唱歌

    房间大小:6 ²

    混响时间:15 s

    阻尼:0.9

    输入带宽:0.1

    干信号级别:-10 dB

    早期反射级别:-10 dB

    尾部级别:-10 dB

  • 教堂的最后一排

    房间大小:200 m²

    混响时间:9 s

    阻尼:0.7

    输入带宽:0.8

    干信号级别:-20 dB

    早期反射级别:-15 dB

    尾部级别:-8 dB

Freeverb 是一个较老的混响插件,使用起来更简单,而且在我听起来它听起来更好(图 11-23

图 11-23. Freeverb 是另一种混响效果。

如果 Freeverb 没有包含在你的 Audacity 安装中,请访问 SourceForge 上的 Freeverb3 主页以获取源代码和二进制文件(freeverb3.sourceforge.net/))。

现在让我们看看内置的 Audacity 效果插件。

放大

我经常使用效果 > 放大效果来增加和减少振幅。除非你确实想要这样做,否则不要勾选“允许削波”或超过零,因为任何更大的值都会被削波和失真。增加 3 dB 是双倍,而 1 dB 是我们能感知的最小变化。输入一个负值,例如-3 dB,以降低振幅。放大可以应用于选择、整个轨道或一组轨道。

自动鸭

这是一种非常适合带有背景音乐音轨的录音效果,例如播客,因为它会在前景音轨切入时自动降低音量,并在前景音轨切出时提升音量。在图 11-24 中,我们看到设置:上层是立体声背景音乐音轨,下层单声道音轨是语音音轨。当语音开始时,我希望音乐音量降低,当语音停止时,音乐应恢复到原来的音量水平。它们必须按照这个顺序:背景音轨在上层,控制音轨在下层。

使用 Auto Duck,背景音轨在上层,前景或控制音轨在下层

图 11-24. 使用 Auto Duck,背景音轨在上层,前景或控制音轨在下层

选择背景音轨,然后点击效果 > Auto Duck。您将看到一个控制面板,类似于图 11-25 中的面板,它显示了我想使用的设置。这些设置创建了一个快速淡出和一个缓慢淡入。背景音轨快速地让位,并以优雅的方式慢慢滑回,与语音音轨只有一点重叠。

Duck 量是指你希望在背景音轨上减少的音量。

最大暂停时间决定了总的淡入和淡出所需的时间。外淡出长度和外淡入长度值的总和不能超过最大暂停时间值。

外淡出长度设置决定了在控制音轨上的语音恢复之前,背景音轨将如何快速淡出。图表中两条垂直线之外的内容发生在控制音轨低于你的阈值时。内淡出长度设置决定了与控制音轨的重叠程度。

外淡入长度设置控制当控制音轨上的语音停止时,背景音轨恢复的快慢,内淡入长度设置控制重叠。在语音上轻轻上升半秒的音乐并不多;我认为这使过渡变得很棒。图 11-26 显示了应用 Auto Duck 效果后这些音轨的外观。

快速淡出和缓慢淡入的 Auto Duck 设置示例

图 11-25. 快速淡出和缓慢淡入的 Auto Duck 设置示例

应用了 Auto Duck;与.比较

图 11-26. 已应用自动 duck;将其与图 11-24 进行比较。

阈值设置控制触发自动 duck 效果的声音电平。

变调

变调会改变音高而不改变节奏,因此您可以在不加快或减慢速度的情况下调整音频的音高。我曾在音调有点不准的音轨上使用过这个效果,它做得很好。变调效果会尽力检测您选择项的当前频率和音高,然后您可以从那里向上或向下调整(图 11-27

图 11-27. 变调效果提供了几种测量音高变化的方法。

Phaser

使用效果 > Phaser将信号分成两部分(一部分湿音和一部分干音),将您的设置应用于湿音轨道,然后将它们合并回一个。它的主要目的是创建振荡或颤音效果,多亏了现代电子技术的奇迹,您还可以将其应用于多种额外的效果。尝试在您自己的声音录音或纯正弦波上使用它,以了解它能做什么。相位器(相位移位器)是一种在所有类型的音乐中都广泛使用的流行效果:用于在电吉他上创建高飞效果,用于美化键盘,以及制造各种太空科幻噪音(图 11-28

图 11-28. 相位器效果创造出多种迷人而诡异的音效,从高飞的人声到外星人。

阶段设置决定了同时使用的过滤器数量,从 2 到 24 个。更高的值会创建一个更复杂、分层的音色,具有多个振荡。

干/湿平衡接受从 0 到 255 的值,其中 0 是完全干音,255 是完全湿音。

LFO 频率是一种低频振荡,它创造出脉冲节奏或颤音类型的效应。在相位器对话框中,可用的 LFO 频率范围是从 1 到 40 Hz,或者每秒 1 到 40 个脉冲。增加这个设置的值可以产生戏剧性的效果,这取决于其他设置以及它们之间的相互作用。例如,尝试将 LFO 频率和深度都设置为最大值,看看会发生什么。你知道游泳池中的涟漪是如何扩散开来,反弹到边缘,反弹回来,并相互碰撞的吗?声波也是这样做的,你无法总是预测结果。记住声波是三维的,所以它们无处不在,而不仅仅是像水波那样在一个相对平坦的平面上。

相位变化是以圆的度数来衡量的。

图 11-29. 相位变化是以圆的度数来衡量的。

LFO 起始相位决定了信号的相位变化,从 0 到 359 度。没错,就像一个圆圈。相位变化的程度最容易被通过查看图 11-29 来解释。正弦波在正电压和负电压之间平滑地交替;正电压位于中心线之上,负电压位于中心线之下。波形穿过中心线的位置是零交叉点,因为那是电压为零的点。正弦波的起始点是零电压上升到正电压;180 度是零交叉进入负电压。当它从负电压回到零电压时,那是一个完整的 360 度。

你可能还记得本章前面提到的这一点是如何影响你的音频信号的:两个波形在彼此相差 180 度相位时相互抵消,不同程度的相位变化组合起来创造出不同的声音,从简单的回声到奇怪的太空外星人噪音。

你也可以用 Slinky(弹簧圈)三维地展示这一点。没错,Slinky 不仅仅是一个玩具——Slinky 是一个物理教学工具。Slinky 是一个螺旋线,它代表三维空间中的音频相位。Slinky 在纵波中产生涟漪,就像声音一样,在横波中产生像乐器拉伸的弦一样的波形。Slinky 展示了谐波和振幅。Slinky 令人惊叹,研究“Slinky 的物理”将带你进入各种迷人的知识(图 11-30))。

深度通常指的是音调弯曲的程度,从 0 到 255,数值越高,颤音效果越明显。然而,Audacity 的 Phaser 似乎弯曲的是振幅而不是音调,这使得信号快速淡入淡出。将这个值与 Stages 值一起调高,可以得到一些有趣的外星生物声音。

最后,Feedback 是熟悉的失真效果,它增加了沙沙声和质感。百分比越高,失真越明显。将 Dry/Wet 平衡和 Feedback 值调至最大,可以生成一些像老电影中使用的非常奇怪的科幻声音。

Slinky 展示了声波的多项属性。(图片来源:由 Wikipedia 用户 Roger McLassus 创建,发布于 GFDL 许可下。)

图 11-30. Slinky 展示了声波的多项属性。(图片来源:由 Wikipedia 用户 Roger McLassus 创建,发布于 GFDL 许可下。)

Reverse

Reverse 是一个简单的效果,没有选项——它将你的音频倒放。在 20 世纪 70 年代,当那些不赞成翻唱黑胶唱片以寻找撒旦信息的人时,这会节省他们很多麻烦。无论如何,这都是浪费时间,因为带有恶魔信息的唱片正面播放。

滑动时间缩放/音调转换

这是一个有趣的新效果,可以改变节奏或音调,或者两者兼而有之。但不仅如此——它还具有滑动效果,所以你可以从慢到快,从低音到高音,同时进行,也可以反向。我知道,所有这些效果都在精彩的《洛 oney Tunes》和《Merrie Melodies》卡通中做过。但他们不得不通过昂贵设备艰难地完成。

选择动态瞬态锐化复选框似乎会导致动态范围更广,但失真略少。过度使用滑动时间缩放/音调转换将产生失真,而且它是一个耗能大户——在老式慢速电脑上会花费很长时间。

WahWah

就像名字所说的一样,这会让你的信号发出“哇哇”的声音。也许我很容易被逗乐,但将夸张的 WahWah 效果应用到普通的音乐曲目上每次都能让我捧腹大笑。更严肃地说,WahWah 效果能让乐器听起来像人声。这个效果最著名的应用之一是在 Frampton Comes Alive 专辑中的歌曲“Do You Feel Like We Do。”(承认吧,你仍然拥有那套黑胶双碟,偶尔会拿出来听听。别害羞;这是一张伟大的专辑,Frampton 先生是一位出色的吉他手。)WahWah 的另一个突出应用是在 Steely Dan 的“Haitian Divorce”中,收录于Royal Scam专辑,它给主吉他增添了一种讽刺的声音。

WahWah 类似于相位移动。它使用 LFO 来设置每秒的振荡次数,从 0.1 到 4 Hz。没错,从 0.1 到 4,比 Phaser 效果慢得多。

LFO 起始相位和深度与 Phaser 效果的设置类似。

WahWah 效果使乐器“说话”,并在左右声道平衡上玩弄技巧。

图 11-31。WahWah 效果使乐器“说话”,并在左右声道平衡上玩弄技巧。

共振增强高频;1 是最小效果,10 是最明显。

Wah 频率偏移在较低百分比设置时强调低频,在较高设置时强调高频。如果设置过高,会导致削波(图 11-31)。

WahWah 效果调整立体声轨道左右声道的相位,使轨道听起来像在扬声器之间来回移动。

现在让我们来看看如何在 Linux 和 Windows 中查找和管理 Audacity 插件。

Linux 插件

在 Linux 中,Audacity 插件有两种类型:LADSPA 和 Nyquist。

Linux LADSPA 插件

有几个专门针对多媒体制作的 Linux 发行版,例如 64 Studio、dyne:bolic、Planet CCRMA(这是为 Fedora 和 CentOS 提供的特殊软件包集合)和 Ubuntu Studio。安装 LADSPA 插件有两种方式。一种方式是使用您的 Linux 包管理器。64 Studio 包含超过 300 个插件的捆绑包。Debian 和 Ubuntu 将它们拆分为单独的包。以下是 Debian 和 Ubuntu 中的一些 LADSPA 插件包:

  • blepvco(LADSPA 抗混叠、基于 minBLEP、具有硬同步功能的振荡器插件)

  • blop(为 LADSPA 宿主提供的带限 wavetable 振荡器插件)

  • caps(C*音频插件套件)

  • cmt(计算机音乐工具包 LADSPA 插件集合)

  • ladspa-sdk(对用户和开发者有用的 LADPSA 工具)

  • swh-plugins(Steve Harris 的 LADSPA 插件)

  • tap-plugins(Tom 的音频处理 LADSPA 插件)

  • vamp-examples(音频分析插件)

在下载仓库的“声音”部分查找这些插件。通过您喜欢的图形包管理器安装它们,或者使用命令行工具,例如aptitude,例如aptitude install blepvco,或者您想要的任何包名。

下面是 Planet CCRMA 中的一些插件包:

  • ladspa-blop-plugins(为 LADSPA 宿主提供的带限 wavetable 振荡器插件)

  • ladspa-swh-plugins (Steve Harris 的 LADSPA 插件)

  • ladspa-cmt-plugins(计算机音乐工具包 LADSPA 插件集合)

  • ladspa-mcp-plugins(由 Fons Adriaensen 开发;目前包含一个移相器、一个合唱和一个 moog vcf(电压控制滤波器))

  • ladspa-fil-plugins(四频段参数均衡器)

  • ladspa-rev-plugins(基于 gverb 的混响,以及新功能)

  • ladspa-tap-plugins(Tom 的音频处理 LADSPA 插件)

  • ladspa-vco-plugins(抗混叠 Dirac 脉冲振荡器)

  • ladspa, ladspa-devel(对用户和开发者有用的 LADPSA 工具)

Fedora 有一个图形化软件包管理器,或者您可以从命令行运行 yum,例如 yum install ladspa-blop-plugins

您也可以通过简单地将插件复制到 /usr/lib/ladspa/,这样它们就可以被系统上的所有用户访问,或者复制到您个人的家目录中,例如 /home/carla/.ladspa,这意味着它们只能由您自己使用。所有 LADSPA 插件都有 .so 扩展名,例如 gong_1424.so

LADSPA 代表 Linux 音频开发者简单插件 API。这是一个为编写通用插件而设计的框架,这些插件可以在任何 Linux 音频应用程序中工作,因为它为应用程序开发者提供了一个通用、简单、文档良好的应用程序编程接口 (API)。因此,大量 Linux 音频应用程序支持 LADSPA 插件:Audacity、Ardour、ReZound、Rosegarden、GNU Sound 以及许多其他应用程序。

有几个流行的 LADSPA 插件项目:

自然,这个列表只显示了其中的一小部分;还有更多。

LADSPA 版本 2 (LV2) 是 LADSPA 的继任者。它更易于扩展,更灵活。Audacity 的 Linux 版本从 1.3.6 版本开始支持 LV2。访问 www.lv2plug.in/ 获取关于 LV2 插件的最新信息,例如史蒂夫·哈里斯的 LV2 插件 (www.plugin.org.uk/lv2/) 以及其他活跃的 LV2 项目。

您可以通过安装 ladspa-sdk 软件包来获取关于各个 LADSPA 插件的详细信息。这是您需要学习的软件包,以编写自己的 LADSPA 插件,它还包括一些用于获取插件信息的实用命令。listplugins 会显示您安装的所有插件,如下面的片段所示:

$ listplugins

/usr/lib/ladspa/sine.so:
       Sine Oscillator (Freq:audio, Amp:audio) (1044/sine_faaa)
       Sine Oscillator (Freq:audio, Amp:control) (1045/sine_faac)
       Sine Oscillator (Freq:control, Amp:audio) (1046/sine_fcaa)
       Sine Oscillator (Freq:control, Amp:control) (1047/sine_fcac)
/usr/lib/ladspa/noise.so:
       White Noise Source (1050/noise_white)
/usr/lib/ladspa/triangle_1649.so:
       Bandlimited Variable Slope Triangle Oscillator (FASA) (1649/triangle_fasa_oa)

analyseplugin 提供了关于各个插件的详细信息,例如以下简化的示例:

$ analyseplugin gong_1424.so

Plugin Name: "Gong model"
Plugin Label: "gong"
Plugin Unique ID: 1424
Maker: "Steve Harris <steve@plugin.org.uk>"
Copyright: "GPL"
Must Run Real-Time: No
Has activate() Function: Yes
Has deativate() Function: No
Has run_adding() Function: Yes
Environment: Normal or Hard Real-Time

Linux Nyquist 插件

Nyquist 插件也适用于 Linux,并且具有 .ny 扩展名。您可以从 Audacity 网站下载一些 (www.audacity.sourceforge.net/download/nyquistplugins),网络搜索还可以找到数百个。通过将它们复制到 /usr/share/audacity/plug-ins/ 以实现系统级使用,或者复制到 $HOME/.audacity-files/plug-ins 以保留它们供自己使用来安装这些插件。Nyquist 编程语言 (www.audacity.sourceforge.net/help/nyquist) 是免费且开源的,因此您可以随心所欲地编写和分发自己的 Nyquist 插件。

Windows 插件

三种插件类型在 Windows 上运行:VST、LADSPA 和 Nyquist。

Steinberg 的虚拟工作室技术(VST)是 Steinberg 为其 Cubase 系列 MIDI 和音频录制和生产软件发明的插件标准。Steinberg 将 VST 许可给第三方开发者,以便他们可以为任何宿主创建 VST 插件;因此,VST 是最广泛使用的插件标准。Audacity 附带了一些基本插件,如 Gverb、Tremolo 和 Vocal Remover。

VST 插件有.dll扩展名。Audacity 下载页面(www.audacity.sourceforge.net/download/plugins)提供了更多链接,以及一个已知与 Audacity 兼容的 VST 插件目录。安装这些插件意味着只需将它们复制到\Program Files\Audacity\Plug-ins

你还可以在这个页面上找到在 Windows 上运行的 LADSPA 插件。Nyquist 插件也在 Windows 上运行;再次,只需将它们复制到\Program Files\Audacity\Plug-ins

互联网上充满了音频插件,你可以使用其他音频生产软件附带的插件。

音频效果术语表

音频效果有自己的术语,让我们看看你将遇到的一些更常见的术语,与音频插件相关。

全通滤波器

一个对所有频率都平等通过并应用相移的滤波器。混响效果使用全通滤波器。

衰减

衰减控制声音消失的速度是快还是慢。

延迟

这控制着混响的程度和它的声音,是仅仅一个明亮活泼的触摸还是过度处理的泥泞混乱。在古代,这是通过磁带循环和改变录音和播放磁头之间的间距在磁带录音机上完成的。现在你只需要移动一个滑块或输入以秒或秒分数的数值。

四个基本音频波形

波形是声音的视觉表示,对音频来说,四个基本的波形是重要的:正弦波方波锯齿波三角波。图 11-32 展示了它们并排,归功于维基媒体。它们的形状涉及到各种高级数学,这肯定超出了本书的范围以及我自己的微薄数学知识。这些波形不仅限于音频,还用于许多学科,如数学、物理、电子工程以及各种信号处理。

四个基本波形

图 11-32. 四个基本波形

谐波

谐波可以被认为是泛音,尽管一些教科书说它们并不相同,然后使用大量的高级数学来展示为什么。我们将保持在这个训练轮级别:当你在一台乐器上弹奏一个音符时,这就是基频。这个音符可能还伴随着谐波,这些是基频的整数倍的其他音符。所以,100Hz 的基频可以有 200Hz、300Hz、400Hz 等谐波。这些按顺序编号:基频、2、3、4,等等。方波只包含奇数谐波,而锯齿波则包含偶数和奇数。

保留较宽的频率范围(由采样率控制)的一个原因是为了保留谐波,因为即使你听不到完整的频率范围,你也能听到谐波。缩小频率范围会损失你听到的范围内的某些谐波。

高通滤波器

这允许高频无改变地通过,同时衰减低于截止点的较低频率。所以,你可以使用这个来降低低沉的低音或不平衡的中频频率。

低通滤波器

这允许低频无改变地通过,并衰减高于你设置的截止点的高频。使用这个来降低录音中听起来太亮的高频或存在如磁带或唱针嘶嘶声等噪音。

低通滤波器也用于高保真电子设备中,将低频声音路由到低音炮或能够处理它们的任何扬声器。

混响

混响是最常用的效果之一;它试图模拟我们像在音乐厅或舞台表演中听到的现场声音。混响是回声,或声音反射,它们发生得太快,以至于无法单独感知。这就是给音乐作品带来“现场”感的原因:当我们参加现场表演时,音乐会从我们周围无数表面上反射。录音室通常是一个故意“死寂”的环境,因此没有自然混响。所以,混响被应用于录音以使其生动并使其听起来更真实。在现场表演中,它被用来创造更大的、更宽敞的声音。你无法控制你表演的地方的声学效果,但你可以通过你的电子设备做很多事情来克服不良声学效果,并调整你的声音以模拟不同的环境。

刚度

这试图复制不同刚度水平下物理物体的声音,例如木管乐器簧片、钹和锣。

湿/干平衡

一个信号还没有应用任何特殊效果;应用效果后,音频信号变为湿。大多数插件和硬件特殊效果混音器只允许成比例的调整;如果你的湿平衡是 45%,那么你的干平衡是 55%。

第十二章. 修复和清理

无标题图片

Audacity 有许多工具可以修复缺陷和清理录音。我一直在说,你最好的方法就是尽可能制作最干净的录音,因为这比修复它们要容易得多。没有电视犯罪节目中的魔法;你可以做的事情有限。

然而,你可以做很多事情来解决问题,所以我们将在这章中学习如何做到这一点。(如果你需要复习,第一章涵盖了 Audacity 的基本使用方法,第二章则深入介绍了如何建立一个简单的录音室。)

拆分立体声轨道

通常情况下,立体声轨道中只有一半会有缺陷。因此,你应该将轨道拆分(在轨道菜单中选择“拆分立体声轨道”),独立地对每个轨道进行修复,然后从轨道菜单中选择“制作立体声轨道”将它们重新连接。这样,好的那一半就能帮助掩盖不完美的修复。

重复上次效果

注意效果菜单顶部的“重复上次效果”(ctrl-R)命令。这是一个快速重复应用相同效果和设置的方法。效果菜单有点不方便,因为当你点击“确定”时,效果就会消失,所以当你需要重复使用相同的效果时,每次都要再次浏览整个菜单,这会变得有些繁琐。

噪音消除

没有像电视犯罪实验室技术人员使用的魔杖那样神奇的好莱坞魔法棒,他们从受损的低质量录音中清理出来,分离出所有不同的元素,并神奇地从背景中隔离出坏人的声音指纹……或者匹配逃跑车辆的引擎噪音的精确波形,识别出品牌和型号,从脚步声的声音中识别出罕见的定制鞋子,或者电视编剧想出的其他任何奇妙的事情。事实并非如此。试图在单个轨道上分离多个声音就像试图分解一杯混合饮料一样;一旦所有东西都混合在一起,实际上就没有实用的方法可以再次分离它们。噪音消除总是与其副作用妥协,这就是为什么录音室使用多轨录音机在隔音室中录音——因为获得干净的录音总是比试图清理脏录音要好。

然而,有时不想要的噪声会悄悄混入,你无法享受重新录制的机会。当噪声明显不同于你想要保留的内容,并且你有纯噪声样本来构建噪声配置文件时,Audacity 的降噪效果工作得相当好。一个常见的例子是黑胶唱片专辑的唱针嘶嘶声或转盘嗡嗡声。这些很容易清理:首先选择仅包含嘶嘶声或嗡嗡声的部分,然后点击效果 > 降噪 > 获取配置文件以创建噪声的配置文件。确保只选择噪声,并且尽可能长,最长可达 30 秒。即使是 5 到 10 秒的配置文件也可以工作,但较长的配置文件更准确。当 Audacity 完成构建配置文件后,降噪面板将消失。

下一步是选择你想要修复的音轨部分,选择效果 > 降噪,然后点击确定。最好尽可能精确地应用降噪,因为它会改变你的录音。除非你特意去听,否则差异可能不明显,但它确实会对你想要保留的部分产生可感知的变化。

如果你不喜欢结果,按 ctrl-Z 撤销,更改一些设置,然后再次尝试。默认的降噪级别是-24 dB,这意味着被识别为噪声的频率衰减了-24 dB。如果这移除了录音中的太多内容,请设置更高的分贝值,例如-20 dB,然后再次尝试。一个经常有效减少不良副作用的方法是回到你的噪声样本,降低其幅度几 dB,创建一个新的配置文件,然后再次尝试。你很可能无法完全消除噪声,因为这样做可能会消除你想要保留的内容,但你可以将噪声降低到不那么明显的地方。

频率平滑滑块在较小值时更为精确,并且当你将滑块向右移动以设置较大值时,它会影响更宽频率范围。先尝试较小的值,因为它们会影响你录音的较少部分。

攻击/衰减时间滑块决定了降噪效果对音频信号变化的响应速度。对于相对稳定的噪声,使用较大的值。如果噪声快速波动,则使用较小的值以获得更快的响应时间(图 12-1)。

这显示了某些温和的降噪设置:被识别为噪声的频率降低了 19 dB,频率平滑较窄,攻击和衰减时间适中慢。

图 12-1. 这显示了某些温和的降噪设置:被识别为噪声的频率降低了 19 dB,频率平滑较窄,攻击和衰减时间适中慢。

标准化

归一化效果(效果 > 归一化)是许多数字录音室的工作马,因为它通常会将录音的峰值设置为-12 dB 或更低,有时甚至低至-24 dB。归一化通常是导出前的最后一步,将你的录音提升到更高的峰值音量水平。数字音频具有如此广泛的动态范围,你可以保守地记录到峰值水平以避免失真,然后稍后归一化你的轨道,将峰值水平提升到舒适的播放水平。

归一化也被用来将多个轨道提升到相同的峰值音量水平。如果你想保留不同轨道的相对音量水平,不要使用归一化。例如,如果你有一个峰值在-6 dB 的轨道和另一个峰值在-12 dB 的轨道,并且你想保持 6 dB 的分布,不要使用归一化;使用放大。使用放大,你可以将它们提升或降低一定的量,例如+3 dB,这将使它们分别提升到-3 dB 和-9 dB。但如果你想将两个轨道都提升到-3 dB 的峰值,那么归一化就是这项工作的工具。

总是勾选“移除任何直流偏移”,因为直流偏移不是你想要保留的东西。如果有任何直流偏移,这表明你的平均幅度不是零。一点偏移没什么大不了的,但如果偏移很大,它会破坏你的动态范围,甚至可能造成一些失真(图 12-2)。

直流偏移从零开始的直流偏移的简称。直流最初意味着直流电,但现在它适用于表示任何类型信号的任何波形。图 12-3 显示了前后对比:顶部的轨道是原始的、未归一化的轨道,带有一点直流偏移,底部的轨道是归一化且没有直流偏移。

总是检查“移除任何直流偏移”和“将最大幅度归一化到”并设置最大分贝值为零或更低。

图 12-2. 总是检查“移除任何直流偏移”和“将最大幅度归一化到”并设置最大分贝值为零或更低。

前后对比:顶部是未归一化的轨道上有一点直流偏移;底部是校正后的直流偏移和归一化

图 12-3. 前后对比:顶部是未归一化的轨道上有一点直流偏移;底部是校正后的直流偏移和归一化

移除点击和划痕

Audacity 提供了几种快速清理黑胶唱片刮擦录音的方法。数字录音也可能从各种来源捕捉到点击声。其中之一是点击消除:它不如手动修复刮擦可靠,但速度快,效果相当不错。

点击消除

点击消除效果(图 12-4

图 12-4. 点击消除效果只需两个设置。

这里是一个小于 3 毫秒的点击声。

图 12-5. 这里是一个小于 3 毫秒的点击声。

要了解使用最大尖峰宽度值,首先将选择工具栏上的选择开始值设置为长度,并将时间参数设置为 hh:mm:ss + 毫秒。然后放大波形中的点击声并选择它,你将得到它的长度(毫秒)。最大尖峰宽度应该足够大,以便包括点击声两边的良好音频样本,这样它就会有足够的良好音频进行比较。图 12-5 显示了一个小于 3 毫秒的尖峰。我通常坚持使用默认的 20 毫秒,这通常能给出良好的结果。

响亮、明显的刮擦是最容易处理的。点击消除效果不太擅长处理轻微、沙沙的静电部分;噪声消除效果更适合这种情况。点击消除速度快,效果相当不错,但不是百分之百准确,它可能会将打击乐效果误认为是刮擦。

修复

使用修复效果平滑处理的一个简短的剪辑段

图 12-6. 使用修复效果平滑处理的一个简短的剪辑段

修复效果是我修复划痕的首选工具。它必须手动应用,一次修复一个划痕,但它做得很好。放大直到您可以精确选择不超过 128 个样本的区域,然后选择效果 > 修复。它将删除选择并使用插值来平滑填补空隙。这是一个适用于所有类型的外科修复工具:点击声、划痕、爆裂声和短剪辑段。使用修复效果平滑剪辑段显示了剪辑段修复前后的对比。

绘图工具

使用绘图工具平滑点击声

图 12-7. 使用绘图工具平滑点击声

绘图工具(工具栏)让您在样本级别上对修复拥有终极控制权。首先放大足够,以便看到单个音频样本。光标变为一个小铅笔,然后您可以使用它来平滑缺陷的轮廓,使其不那么明显。声音本身并没有改变,因为您只是让它变得更安静,正如图 12-7 所示。

截断静音

如果您有一段较长的录音,您想通过几分钟来修剪,而不丢失任何音频呢?也许您有一段有很多静音的录音,您想修剪。歌曲之间的停顿太长,您的深思被长时间的停顿所打断,或者您有一个带有大量静音的声激活录音。截断静音效果将自动找到并缩短这些静音间隔。

在您创建了淡入和淡出之后,不要使用截断静音效果,因为它会破坏它们。

截断静音的这些设置寻找超过 800 毫秒的静音段落,然后将任何-40 dB 或更低的静音缩短到 800 毫秒。

图 12-8. 截断静音的这些设置寻找超过 800 毫秒的静音段落,然后将任何-40 dB 或更低的静音缩短到 800 毫秒。

效果 > 截断静音有四个设置:最小静音时长、最大静音时长、静音压缩和静音阈值。使用此效果最简单的方法是将最小和最大时长设置为相同的值,并调整您的阈值,以便它只捕捉到静音段落。在图 12-8,任何超过 800 毫秒长的静音段落(-40 dB 或更低)将被缩短到 800 毫秒。(1,000 毫秒等于 1 秒。)

不要将最大静音持续时间设置为零,因为它可能会崩溃或执行一些不可预测的行为。我发现最可靠的值是 5 毫秒,尽管有些人将其降低到 1 毫秒。如果你根本不想有静音,你将不得不手动删除它们,尽管对我来说,1 毫秒的效果和零一样好。

静音阈值告诉它使用什么阈值来标记静音段落开始的地方。当静音段落真正静音时,-35 dB 或-40 dB 的值效果很好;当它们像黑胶唱片那样嘈杂,歌曲之间有唱针噪音或转盘嗡嗡声时,你可能需要将其提高到-25 dB。

静音压缩设置配置了一个比率,而不是静音持续时间的固定长度,这样你的静音长度就会变化。你可能想使用它来保留说话声音的自然节奏,或者使现场表演听起来更真实。假设你的最小持续时间是 100 毫秒,最大持续时间是 5,000 毫秒。如果你将静音压缩设置为 4:1,那么 10 秒的静音将减少到 2 秒。结果将根据你的最大持续时间和最长静音之间的差异而变化。为了得到可预测的结果,你可以使用截断静音将最长静音缩短到你想要的任何最大值,然后再次使用静音压缩应用它。

改变节奏

改变节奏效果是一个很好的小修复工具,当你混合多个轨道且其中任何一个的节奏略有偏差时。它改变节奏而不改变音调。你可以将其应用于选择、整个轨道或多个轨道。有几种方法可以接近这个问题。一种是通过试错;只是调整百分比变化设置,直到听起来正确。有些人有很好的耳朵,可以快速做到这一点。你还可以设置每分钟节拍数(BPM)。如果你的其他轨道遵循已知的 BPM,则使用此设置。如果你不知道正确的 BPM,播放一分钟正确节奏的轨道并数节拍。我用秒表做这件事,当没有人打扰我并打断我的计数时,效果很好。

改变节奏提供了三种校正节奏的方法,以及一个预览按钮。

图 12-9. 改变节奏提供了三种校正节奏的方法,以及一个预览按钮。

最后,有一个以秒为单位的长度设置。如果你确切知道你的轨道或选择应该有多长,这是一个快速且简单的方法来正确设置它(图 12-9)。

改变音调

改变音调不会改变节奏

图 12-10. 改变音调会改变音调而不改变节奏。

这项功能在不改变节奏的情况下改变音调,因此当表演者走音时,它是一个很好的修复方法。你可以将其应用于选择、整个轨道或多个轨道。如图图 12-10 所示,它提供了几种不同的设置:你可以改变调性,例如从 A 调到 C 调,或者通过半音(半步)、精确频率或百分比。如果你有很好的耳朵,百分比变化滑块和预览按钮可能最快。

你如何精确测量音调?改变音调效果尽可能地接近,尽管使用电子调音器可以获得更高的精度。

改变速度

我相信改变速度效果有许多实际应用,但我似乎总是用它来娱乐,因为它会同时改变节奏和音调,就像玩转盘速度一样。所以,你可以加快音频的速度来播放得又快又高,就像过度摄入咖啡因的阿尔文和芯片鼠,或者像著名的男低音歌剧演员塞缪尔·拉梅伊在服用镇静剂时那样低沉缓慢。它支持标准的转盘速度 33 1/3、45 和 78 RPM,以及通过滑块或输入百分比值的任意速度范围(图 12-11)。

改变速度同时改变音调和节奏。

图 12-11. 改变速度同时改变音调和节奏。

压缩动态范围

这是一个动态范围压缩器,不要与文件压缩混淆。动态范围压缩通常被认为是“使响亮的部分更安静,使安静的部分更响亮。”大多数压缩器仅降低增益;通过衰减响亮的部分来缩小动态范围,从而减少柔和和响亮部分之间的范围。它在商业录音中被过度使用和滥用,这很遗憾,因为当它被谨慎且目的明确地使用时,它是一个有用的效果。我的偏好是尽可能少地使用压缩,因为我认为许多使用压缩完成的“修复”在录音过程中,使用放大或归一化效果,或者使用包络工具处理会更好。

你可以使用压缩来改善录音的平衡,通过减少应该处于背景且不吸引注意力的轨道的动态范围。对音量变化进行一些压缩以使其平稳,并可能降低它们的整体音量,从而使它们成为优秀的配角。你可以为不同的播放设备和环境定制录音。你可以对整个录音或单个轨道或轨道的部分应用压缩。

例如,如果你想在嘈杂的环境中播放背景音乐,压缩其动态范围会使它更容易听,因为你会有一个更一致的音量水平,而不是有意外的高峰和难以听到的段落穿插。一个由多人说话的播客将受益于仔细的音量控制和压缩,尤其是当你记录那些不习惯对着麦克风说话且说话音量不一致的人时。对于这种录音,手动调整幅度直到尽可能一致(包络工具对此非常适用)并然后对最终混音应用一些仔细的压缩以进行最后的润色会得到最佳结果。调整声音轨道可能需要相当多的技巧,因为有些声音即使不是很大听起来也会很响。你还应该考虑到你的听众可能如何收听你的录音——如果他们在工作或戴着耳机听,或者听一些旨在帮助他们入睡的东西,那么请友好地对待他们,不要用音量的突然峰值吓到他们。

压缩可以平滑由不熟练的表演者或当天状态不佳的表演者引起的音量不均匀。例如,你的贝斯手累了,有些音符弹得太重,有些又不够重。或者你的歌手麦克风技术不好,移动太多,所以她时隐时现。也许你有一个需要从混音中脱颖而出的歌手或其他独奏者,因此对他们的轨道应用一些仔细的压缩然后增加幅度会将他们推到前面。

大多数压缩器会使你的选择变得更安静,所以你可能需要在应用压缩后使用放大或归一化效果。

注意

保守地应用动态范围压缩,因为当它过度使用时,可能会产生风箱效应,音量以规律的速度上升和下降。另一个副作用是提高你的噪声水平,因为噪声在较安静的段落中相对更响。还有一个副作用是更强调背景声音,例如观众噪声。过多的压缩可能会引入失真。

动态范围是多少?

那么,当你对录音应用动态范围压缩时,应该追求什么样的动态范围呢?明确的答案是“这取决于。”首先让我们谈谈可能性和我们听到的,然后我们将看看各种情况下的示例。

人类的听觉可以感知大约 120 dB 的范围。数字音频中最大的实际动态范围大约是 115 dB。CD 的动态范围大约是 96 dB。黑胶 LP 可以提供高达 60 dB。一场现场交响乐可能涵盖 80 dB。大多数人的舒适听音范围可能比这窄,大约在 20 到 30 dB 之间,这仍然是一个相当宽的范围。对你来说,可能需要一些尝试和错误。我个人的经验法则是,在理想的听音条件下,在家中使用我的优质立体声高保真音响,没有干扰或有人与我交谈时,我感到 50 dB 的动态范围就足够了。而且那是在我想要听戏剧性的歌剧或交响乐或喧闹的现场摇滚表演的时候。大多数时候,我更喜欢稍微安静一些的东西。

有时候,当你缩小动态范围时,你会在熟悉的录音中听到新事物,因为这样“提升了”安静的部分。(这全都是相对的;降低较大频率的增益会使较安静的部分听起来更响。)你可能会听到脚步敲击钢琴或鼓踏板,表演者低声嘟囔,安静部分有更多的细微差别——除非你亲自尝试,否则你不会知道。

你可以在 Audacity 中轻松实验,通过录制一个简单的测试文件,然后使用效果 > 放大来设置不同的 dB 级别,以获得不同的动态范围感。图 12-12(Figure 12-12)展示了这样一个简单的录音,从-50 dB 开始,每个 10 秒的片段比前一个片段响 10 dB,直到达到最大值 0。

A simple dynamic range test: Starting at -50 dB, each 10-second segment is 10 dB louder.

图 12-12. A simple dynamic range test: Starting at -50 dB, each 10-second segment is 10 dB louder.

现代流行音乐通常被压缩到一个 5 dB 或更小的范围,在峰值幅度或以上,这对好音乐来说是一件糟糕的事情。在许多现代录音和重新制作的老录音中,动态范围非常窄,就像把一切都推到红线一样。没有安静的部分,没有细微差别,也没有对比;它只是一片响亮。这破坏了细微差别和风味。这样做的原因是简单和愚蠢的完美结合——当我们听到不同音量的两段录音时,我们的第一印象倾向于认为更响亮的那段听起来更好。这也被用来在广播、电视或公共场所播放时使曲目脱颖而出。但这样做已经不再有效了,因为大家都这么做。

最终结果是压缩录音的生命力。它是听觉垃圾食品——当然,那块巧克力棒或薯片的第一次咬下去,或者你特别喜欢的任何美味,是非常好的。但你不能只靠垃圾食品生活,很快就会变得令人不满意。过度压缩也是如此;第一次印象可能是一“越响越好!”但听了几分钟后,大多数人会改变主意,更喜欢经过更好制作的录音。即使你没有意识到录音已经被压缩得毫无希望,你也可能会感到疲劳,厌倦听音乐。在网络上搜索响度战争会返回很多有趣的信息。

你可以通过从音乐 CD 中提取一首歌曲,将其导入 Audacity 中,并查看波形来看到这一点并听到这一点。图 12-13 展示了 Rickie Lee Jones 的《杂志》的选段;将其与任何 Top 40 当代 CD 进行比较。“杂志”是一部值得在优质音响系统上仔细聆听的杰作,你可以在波形中看到它没有被压缩成无用的极小动态范围,也没有所有级别都被推到最大。事实上,它离红线还差得远。我更喜欢那些假设我知道如何使用音量旋钮的录音。

《杂志》,由 Rickie Lee Jones 创作,具有一些实际的动态范围。注意峰值远非零,波形中最安静和最响亮的部分之间有相当大的分布。

图 12-13. 《杂志》,由 Rickie Lee Jones 创作,具有一些实际的动态范围。注意峰值远非零,波形中最安静和最响亮的部分之间有相当大的分布。

我不会给出任何糟糕的例子,因为我太胆小而不想指责别人,但你可以通过快速的网络搜索找到很多,也许在你的音乐收藏中也能找到。这是那个老掉牙的底线竞争,是质量与艺术对抗迎合最低共同点的熟悉战斗。在这个现代时代,那就是在小型、低音质的便携式设备和电脑扬声器上播放的低音质 MP3,以及带有糟糕的功率低音单元的响亮系统,对音乐的影响就像辣椒酱对食物一样——一点可以增加标点符号和对比度;大量使用会杀死所有的风味和乐趣,将其变成一种攻击行为。

动态范围压缩滥用的一个更糟糕的例子是电视广告。据说它们不允许比节目更响亮,但它们通过完全没有动态范围,将所有内容推到最大值来规避这一点。(我认为它们也很响。)

压缩器设置

Audacity 的压缩器效果简单,只有几个设置。

图 12-14. Audacity 的压缩器效果简单,只有几个设置。

关于世界现状的抱怨已经足够了。让我们打开效果 > 压缩器,了解不同的设置是如何工作的(图 12-14)。大多数时候,使用压缩分为两步:应用压缩器,然后将压缩段的音量级别提升到你想要的位置。

这是一个只有四个设置的简单压缩器。专业人士使用昂贵的硬件压缩器,而 Audacity 的压缩器在能力上并不完全匹配这些压缩器。但它的效果已经足够好,可以完成基本的压缩任务。

阈值设置决定了音频信号衰减的起始点,以分贝为单位。-50 dB 的阈值意味着所有幅度为-50 dB 及以上的信号部分都将被衰减。在大多数录音中,这将是所有内容。通常你不想压缩所有内容;轻触并针对特定目的进行调整可以获得更好的效果。

噪声门限设置将增益保持在噪声门限设置以下音频的恒定水平。如果你的音轨有很多安静的部分,这可以防止它们被放大。

比率设置决定了将应用多少压缩。4:1 的比率意味着比阈值高 4 dB 的输入信号将被降低到比阈值高 1 dB。无穷大的比率将所有内容降低到阈值水平。在 Audacity 的压缩器效果中,最大值为 10:1。其他压缩器可以达到 60:1,这在实践中等同于无穷大。压缩器中的图表为你提供了一个很好的视觉展示,显示低比率更为温和,而高比率会导致更大的增益降低。

我的做法仍然是“少即是多”。在 Audacity 中很容易进行实验,并聆听不同设置如何影响你的音频质量。我很少使用压缩,很少超过-20 dB 的阈值或 4:1 的比率。如果我觉得录音需要更多,我会停下来思考它真正需要什么——使用包络工具进行一些细致的调整?重新录音?

攻击时间决定了压缩器达到最大效果的速度,而衰减时间决定了压缩消失所需的时间。攻击时间设置得太短可能会导致一些可闻的失真,而衰减时间设置得太长可能会错过一些短峰。你可以通过不同的攻击时间获得不同的效果。例如,一个较长的攻击时间设置,如 0.5 秒,将不会捕捉并衰减尖锐的鼓点,因此这增加了冲击力。快速的攻击时间会抑制打击乐和其他尖锐峰值。你可能希望为歌手设置最快的攻击时间,即 0.1 秒,除非你试图获得一些不寻常的效果。

较慢的衰减时间可以创建一个长而几乎升腾的淡出效果。这是一种常见的用于延长吉他音符的技术。Audacity 的压缩器在这方面表现中等,可以达到 10 秒。如果你追求自然的声音,较快的衰减时间更好。尝试不同的设置,看看它对不同乐器和人声的影响。例如,一个具有快速攻击时间设置和慢速衰减时间设置的鼓轨听起来会很有趣,几乎像是倒退或回声,因为击打不被允许自然衰减,而是在较高的音量水平上保持更长时间。

压缩的常见副作用是泵吸和呼吸声。当你选择一个高的阈值设置并且音轨中有很多变化时,这种情况会发生。压缩器的波动会导致攻击/衰减变得可闻。有时故意这样做很有趣。

有时压缩器会将一些听起来奇怪的碎片附加到你的录音末尾。这是压缩的正常副产品,所以你可以通过在录音末尾填充一些可以删除的内容来处理这个问题,在应用压缩后将其删除。

“压缩后进行 0dB 的增益补偿”如果你本来就要归一化到零,这可以节省一个步骤。

有一个复选框用于“基于峰值压缩”。当此框未选中时,这是默认设置,压缩器会降低高于阈值水平的音量的增益。“基于峰值压缩”会提高高于阈值水平的较安静音量的增益。我认为这听起来不太好;对我来说,它听起来很刺耳,泵吸效果也很难避免。但最终,你得取悦自己的耳朵,而不是我的。

克里斯的动态压缩器

另有一个压缩器,克里斯的动态压缩器(pdf23ds.net/software/dynamic-compressor/),专门为以令人愉悦的方式压缩古典音乐而定制。我认为它对所有类型的音频都工作得很好,比 Audacity 的内置压缩器效果更好。

作者克里斯·卡佩尔(Chris Capel)写这个压缩器的灵感来自于他在嘈杂的环境中经常听古典音乐。在花费了大量时间调整音量控制,但效果并不理想之后,他决定对他录制的音乐应用一些动态范围压缩是解决问题的方法。但他尝试过的压缩器音质不够好,所以他为自己的 Audacity 编写了自己的 Nyquist 压缩器插件。由于它是一个 Nyquist 插件,它将在 Linux、Mac 和 Windows 上工作;只需下载并将其复制到插件目录中。它将出现在效果菜单中的“Compress dynamics”下。它本身就有很好的说明,如图 12-15 所示。

卡佩尔先生不断更新和改进他的插件,因此你可以通过访问他的网站来保持同步。图 12-15 显示了简单视图。还有一个高级视图,显示了所有选项,如图 12-16 所示。要获取高级视图,打开插件文件compress.ny并按照说明操作。这会暴露高级参数攻击和释放速度以及攻击和释放指数。这非常简单,因为你只需要移动几个分号。

克里斯压缩器的默认简单视图

图 12-15. 克里斯压缩器的默认简单视图

克里斯压缩器的高级视图,显示所有选项

图 12-16. 克里斯压缩器的高级视图,显示所有选项

克里斯的压缩器与众不同的地方在于它能够预判接下来会发生什么,并据此调整增益。大多数压缩器并不这样做,而是对音量变化做出反应,因此总会有一定的延迟。有时这会导致突然降低的响亮峰值,或者更糟糕的是,一些失真。克里斯的压缩器运行更加平稳,能够优雅地处理打击乐和其他响亮瞬态事件。阅读他网页上的评论是值得的,他还包括了一些音频样本。源文件compress.ny是一个纯文本文件,包含有用的信息。

克里斯的压缩器是一件很好的作品,让我们来回顾一下它的选项。

压缩比与大多数其他压缩器的压缩比设置不同。它有两种工作方式:动态压缩动态扩展。值范围从-0.50 到+1.25。负值使安静频率更安静,这被称为动态扩展。正值降低响亮频率的增益,这被称为动态压缩

默认值 0.5 相当不错。它保留了大量的原始动态范围,听起来很自然。根据 Audacity 论坛的一些帖子,0.77 与 NPR 广播电台 KPCC Pasadena 相匹配。因此,如果您想模仿 KPCC Pasadena,现在您知道了如何做。

释放速度类似于 Audacity 压缩器中的衰减时间设置,控制压缩何时逐渐消失。取值以毫秒为单位,因此毫秒数越少,释放速度越快。

攻击速度类似于 Audacity 压缩器中的攻击时间设置,控制压缩何时开始应用,直到达到其峰值比率。如果您的录音有很多快速峰值,您可能希望使用更快的攻击速度来捕捉它们。然而,您可以通过较慢的攻击时间来增加鼓点的冲击力,例如,这样它们就不会被压缩得太多。一般来说,音乐的音量增加比减少要快,因此为了与音乐保持同步,攻击时间应该更快,释放时间应该更慢。

释放和攻击速度的影响比 Audacity 压缩器中的对应设置更为微妙,且不太可能引入典型的压缩失真。

压缩硬度控制压缩和释放的速度,硬度值越高,攻击和释放速度越慢;硬度值越低,攻击和释放速度越快,且更具侵略性。这一设置仅在简化视图中出现,类似于设置释放和攻击速度的快捷方式,但无法单独调整。

地板设置设置了一个地板,或称为噪声门;默认值为-32 dB,这意味着低于-32 dB 的内容不会发生变化。使用此设置来定义一个不会改变的低频范围。如果您有一些不希望放大的低级背景噪声,或者您只是不想改变较静音的频率,您可能需要这样做。

噪声门衰减的取值范围是-2 到 10。正值会降低低于地板设置的所有内容的增益,且值越高,降低的增益越大。负值则相反,会提升低于地板设置频率的增益。我通常将其设置为 0,这样就不会产生任何效果,尽管偶尔我也会用它来稍微提升低频。

最大振幅在压缩后提升振幅,因此您可以省略归一化步骤。它不是分贝刻度,因此可能需要一些尝试和错误才能调整正确。(我认为直接应用归一化更容易。)

攻击和释放指数的取值范围是 1 到 6,其中 1 表示不进行任何操作,6 表示进行最大操作。这些设置对您的录音有什么影响?它们与您的攻击速度和释放速度设置协同工作,以控制压缩器的响应速度。Capel 先生建议,默认值 2.00 和 4.00 通常能给出令人满意的结果。

克里斯的压缩器在您关闭 Audacity 后不会记住您的最后设置,而是恢复到compress.ny中的默认值。如果您找到了一些您更喜欢的新设置,您可以通过编辑compress.ny来使这些设置成为默认值。以下是一些在文件中出现的设置:

;control compress-ratio "Compress ratio" real "" .5 -.5 1.25
;control floor "Floor" real "dB" -32 -96 0

前面的数字是默认值,后面的数字集合是最小和最大值。所以如果您更喜欢将压缩比默认设置为 0.6,将地板设置默认为-25,您可以这样更改它们:

;control compress-ratio "Compress ratio" real "" .6 -.5 1.25
;control floor "Floor" real "dB" -25 -96 0

均衡器

这里是在中等设置下的均衡器效果:中等程度的均衡,它减少了响亮的部分并放大了安静的部分,以及-20 dB 的噪声阈值,这非常保守。

图 12-17. 这里是在中等设置下的均衡器效果:中等程度的均衡,它减少了响亮的部分并放大了安静的部分,以及-20 dB 的噪声阈值,这非常保守。

均衡器效果是一种动态范围压缩器,它减少了响亮频率并放大了安静频率(图 12-17). 仔细手动调整振幅、压缩和归一化可以得到比使用均衡器效果更好的结果。均衡器简单快捷,但应用更高程度的均衡时也会引入明显的失真。为什么使用它?因为它快且简单。它在有声读物录音上听起来相当不错,在铃声上效果最佳。对于铃声,尝试中等程度的均衡和-40 dB 的噪声阈值设置。这将使整个波形变得平坦,因此在小型手机扬声器上听起来更丰富、更饱满。

均衡

均衡器让您可以根据频率控制振幅。与我们都习惯的普通低音-中音-高音控制不同,均衡器效果就像拥有几乎无限的音调控制。

注意

在较便宜的播放设备上的现代音调控制趋势是取消低音-中音-高音旋钮,并用预设如摇滚、古典、爵士和现场音乐来代替。我讨厌这些。我想要可以调节的旋钮,该死的,而不是有限功能的廉价微芯片,它们包含了一些人对好声音的有限理解。

均衡器效果有有用的预设选项和许多自定义调整选项。它为旧式黑胶和乙酸酯唱片预设了均衡器校正曲线,例如 1938 年和 1947 年的 RCA,哥伦比亚 LP 和 78,德卡,以及其他一些唱片。1955 年之前的录音没有遵循任何行业标准;只有那时,RIAA 均衡器曲线才被广泛使用,并最终成为行业标准。

均衡曲线的发明是为了克服黑胶和乙酸酯录音的物理限制,因为低频在唱片上占据更多的物理空间。如果不应用均衡曲线,录音将会非常短,唱片上大部分是低音纹路,高音几乎无法察觉。为了补偿,低频被衰减,高频被放大到未经校正的信号听起来很尖锐,几乎没有中音或低音。

注意

当你播放唱片时,你可以通过将耳朵靠近唱针来听到未经校正的信号。

你的唱机设备通过应用均衡校正来补偿这一点,这与原始均衡曲线正好相反:低频被放大,高频被衰减。这就是为什么唱机需要特殊的唱机前置放大器。行业范围内采用 RIAA 曲线意味着所有唱机设备都可以应用相同的均衡校正。

对于当代的 LP 和 45 转速唱片,你只需要一个标准的唱机前置放大器。这是你高保真放大器或计算机录音接口上的唱机插孔。对于老式唱片或对现代黑胶进行定制调整,你可以使用标准的非唱机前置放大器来获取未经校正的信号,然后使用均衡效果应用适当的均衡曲线。或者根据你的口味进行定制。一旦你调整出一个令你满意的定制曲线,就可以使用“另存为”按钮来保存它。

尝试一些均衡预设以获得不同的效果。例如,有些人喜欢那种古老的 AM 广播声音,现在你可以通过amradio曲线轻松地复制它。图 12-18 展示了它的样子,正如你所见,一定是怀旧情绪驱使人们对那种古老的 AM 广播声音情有独钟,因为它丢弃了 100 Hz 到 6,800 Hz 范围之外的所有内容。

许多人都喜爱的 AM 广播声音是一个非常压缩的均衡曲线。

图 12-18. 许多人都喜爱的 AM 广播声音是一个非常压缩的均衡曲线。

均衡化窗口默认打开较小,你可能想要将其拉长和加宽以扩展刻度并为自己留出一些工作空间。左侧的滑块允许你放大你想要工作的分贝范围。图 12-19 显示了绘制曲线视图,而图 12-20 显示了图形均衡器视图。绘制曲线为你提供了 120 dB 的动态范围来操作,而图形均衡器则限制在 20 dB。如果你搞砸了并想要重新开始,点击平坦按钮。

均衡化效果的绘制曲线视图,左侧为分贝刻度,底部为频率刻度

图 12-19. 均衡化效果的绘制曲线视图,左侧为分贝刻度,底部为频率刻度

带有类似硬件均衡器的图形均衡器视图

图 12-20. 带有类似硬件均衡器的滑块的图形均衡器视图

使用绘制曲线与使用包络工具类似。点击蓝色线条创建一个控制点,然后拖动控制点。将其拖出框架外以移除它。控制点可以在任何方向上移动。

你可以使用键盘进行精确增量移动滑块,并将光标悬停在旋钮上显示确切值。

图 12-21. 你可以使用键盘进行精确增量移动滑块,并将光标悬停在旋钮上显示确切值。

图形均衡器滑块可以通过几种不同的方式移动。你可以用鼠标抓住它们。你可以点击滑块旋钮的上方或下方,这将首先移动 8 dB,然后以 4 dB 的增量移动。使用箭头键每次移动 1 dB,而 shift-click 则移动 0.1 dB。将光标悬停在旋钮上会显示你的精确频率和 dB 值(图 12-21)。

当你在绘制曲线视图中时,线性频率刻度设置将刻度从默认的对数视图更改为线性视图。当你想要更详细地查看低频时使用对数视图,当你想要所有频率都均匀表示时使用线性视图。对数视图更接近我们实际感知声音的方式。

图表中有两条彩色线条:一条粗蓝线和一条细绿线。蓝线是您可以操作的线条,绿线显示实际的均衡曲线。如果它们分离,那是因为您试图使曲线过于陡峭。要么调整您的曲线,要么尝试更大的滤波器长度。这控制了 Audacity 一次操作多少个样本。默认值 4,001 在大多数情况下应该工作得很好。较小的值会产生更平滑的曲线,可能听起来更好,尽管您需要敏锐的耳朵和良好的设备才能听到差异。

您可以将音量超过 0,深入到+dB 范围,这是可以的,因为这与音轨波形中的刻度不同。它显示了您应用了多少分贝的增益(或衰减)。例如,RIAA 曲线对 20 到 40 Hz 范围应用了近 19 dB 的增益,没有不良影响。但您仍然必须小心不要通过过高而造成失真,只有通过试验和错误才能在特定录音中找到这一点。在您正在工作的音轨上点击查看 > 显示削波,可以快速查看是否过度了,因为这将用红色条标记任何削波。

修复时间和延迟错误

当您使用时间移动工具时,音轨很容易变得不同步。假设您的音轨都乱七八糟的,您想将它们全部重置为零开始。选择所有音轨,然后选择音轨 > 对齐音轨 > 对齐音轨一起。然后选择音轨 > 对齐音轨 > 与零对齐。您还可以选择音轨 > 对齐音轨 > 与光标对齐,以将它们对齐到任意任意点。

如果您启用了链接音轨,这会通过一个按下的链接音轨按钮来指示,这种方法将不起作用。链接音轨可能不在您的 Audacity 版本中;查看第一章中的工具按钮表以了解更多信息。

时间移动工具是一种快速便捷的方法,可以将音轨或剪辑在时间上向前或向后移动。只需在工具栏中点击时间移动按钮,光标就会变成一个双水平箭头;然后向右或向左拖动您的音轨或剪辑。您还可以将剪辑拖动到其他音轨上。

另一种移动音轨或剪辑精确数量的方法是在其前面添加静音。在您想要静音开始的位置点击,选择生成 > 静音;输入秒数、毫秒数、样本数或帧数;然后点击确定。这将使音轨向右移动,就像在时间上向后移动一样。

当您进行叠加录音时,延迟总是一个问题。Audacity 会自动对叠加的音轨进行时间移动以补偿延迟。默认的延迟校正值是-130 毫秒,这可能不适合您的系统。您可以在编辑 > 首选项 > 录音 > 延迟校正对话框中调整延迟校正值。

您如何知道正确的延迟校正值?一种方法是试错法。一种更精确的方法是使用回环电缆。您需要一个电缆将您的播放输出连接到您的录音输入。在内置声卡上,这很容易——线路输出到录音输入。对于其他录音接口,如 USB 或 FireWire,您必须找到正确的电缆类型,并整理您的输出和输入。

然后将延迟校正设置为 0。确保选择工具栏上的“对齐到”复选框未勾选。选择选择工具栏上的长度单选按钮,并将时间参数设置为 hh:mm:ss + 毫秒。

接下来,生成一个 60 秒长,每秒 180 拍子的节拍器轨道。

然后在传输菜单中,勾选“叠加”复选框,在设备工具栏上选择播放和录音设备,并按下录音按钮。你应该会看到类似图 12-22 的内容。

当您完成录音后,放大直到您可以选择顶部轨道上的点击和底部轨道上相应的延迟点击之间的间隙。如果您不习惯使用鼠标,请使用 shift 和箭头键标记选择。(使用箭头键前后左右上下移动,并使用 shift 和箭头键选择。)您将看到类似图 12-23 的内容。这显示延迟为 177 毫秒,这相当多。

生成回环叠加以进行良好的延迟校正测量

图 12-22. 生成回环叠加以进行良好的延迟校正测量

测量点击轨道上两次点击之间的延迟

图 12-23. 测量点击轨道上两次点击之间的延迟

如果您更改了录音接口,您应该重复延迟测试,因为不同的设备有不同的延迟。

分析菜单

分析菜单包含分析您音频的工具。我将介绍其中两个我认为相当有用的工具,频谱图和静音查找器。

频谱图会生成一个漂亮的彩色图表,显示不同频率的振幅。它有各种各样的算法和函数可供选择。我忽略这些中的大多数,并使用汉宁窗口、频谱算法和 512 或 1024 大小。较小的 Size 值显示更多细节。对我来说有意义的选项是轴。轴提供了对数或线性视图的标准选择。当我使用频谱图时,我寻找明显的指标,而不是分子大小的差异。

Plot Spectrum 的一个实用用途是测量你的环境噪声。你可以在 Audacity 主窗口的输入电平表上获得你的环境噪声水平的大致概念,但 Plot Spectrum 提供了更多的信息。像往常一样设置你的麦克风,然后选择传输 > 定时录音来录制 20 秒的样本。Plot Spectrum 一次只分析 23.8 秒,所以你甚至可以将定时器设置为录制 23.8 秒。图 12-24 显示了环境噪声录音的图表;将光标悬停在任何点上会显示确切的频率、音符以及光标和最近的峰值处的分贝,这些显示在频率刻度下方。

环境噪声的频谱图显示了背景噪声覆盖了从 43 Hz 到 22,000 Hz 的广泛频率范围,从-32 dB 到-82 dB,最低频率的声音最响。

图 12-24. 环境噪声的频谱图显示了背景噪声覆盖了从 43 Hz 到 22,000 Hz 的广泛频率范围,从-32 dB 到-82 dB,最低频率的声音最响。

图 12-24 中的峰值表明存在某种规律性噪声,注意最响的部分都在最低频率。记住,这是按频率测量振幅,而不是时间,所以不要像读波形图那样读它。它显示的是哪些频率最响。由于最低频率的声音最响,我可以切换到对数视图来更详细地查看低频部分(图 12-25)。

对数视图显示了更低频率的更详细情况。

图 12-25. 对数视图显示了更低频率的更详细情况。

任何超过-40 dB 的声音在录音中都可能被察觉,现在我知道要寻找低频噪声的来源。结果发现是客厅音响的低音炮。一个相当好的目标是-50 dB,而-60 dB 则能确保你的录音中不会有背景噪声。

“绘制频谱”的另一个良好用途是更精确地了解您打算应用压缩的录音的动态范围。读取您最高峰值和最低谷值,然后您将有一些实际数字来帮助您确定要使用的阈值。一个好的起点是取平均值:如果您的最高峰值是-5 dB,最低值是-35 dB,那么尝试一个-20 dB 的阈值设置。您的耳朵会告诉您什么有效;这只是为了给您一个合理的起点。

生成不同频率的正弦波可能会有所帮助,以便熟悉阅读“绘制频谱”图表,并尝试不同的算法和窗口。图 12-26(图 12-26. 这个“纯净”的 8,000 Hz 正弦波实际上包括了 6,000 到 10,000 Hz 的频率,并且随着振幅的增加,频率范围变窄。)显示了 0.8 振幅的 8,000 Hz 正弦波的样子。

这是一个“纯净”的 8,000 Hz 正弦波,实际上包括了 6,000 到 10,000 Hz 的频率,并且随着振幅的增加,频率范围变窄。

图 12-26. 这个“纯净”的 8,000 Hz 正弦波实际上包括了 6,000 到 10,000 Hz 的频率,并且随着振幅的增加,频率范围变窄。

如您所见,我们的“纯净”音波并不那么纯净,频率范围从 6,000 Hz 到 10,000 Hz。随着振幅的增加,频率范围变窄,从-48 dB 的 7,500 Hz 到 8,500 Hz,到 0 dB 的 7,800 Hz 到 8,100 Hz。

当您在单个音轨上有许多歌曲,并希望找到歌曲的静音部分并自动创建标签时,Silence Finder 可能很有用。然后您可以选择导出 > 多个来将音轨拆分为单个歌曲。如果您想使用歌曲名称作为标签,您仍然需要自己输入。如果静音不干净且定义不明确,则效果不佳。例如,当您将黑胶唱片转换为 CD 时,Silence Finder 将是一个节省时间的实用工具,但黑胶唱片在歌曲静音部分通常有足够的噪音,可能会使其混淆。

您可以使用“绘制频谱”来了解歌曲中的静音部分音量水平,然后通过更少的尝试和错误将低于此水平的音频设置为静音值。这里有一个有趣的小技巧:不要输入负号,因为这看起来是自动应用的(图 12-27)。

Silence Finder 的一些示例设置

图 12-27. Silence Finder 的一些示例设置

第十三章. 配置 Linux 以获得最佳音频质量

无标题图片

Linux 音频虽然杂乱但功能强大。本章是指导如何正确配置一切以适应高端音频制作的指南。Linux 是一个出色的多媒体平台:它稳定,它灵活,如果你使用轻量级的图形环境,你将能从普通硬件中获得更好的性能。尽管 Linux 音频有一些粗糙的边缘,但它正在快速发展,并且拥有自己的复杂音频软件宇宙。

你可以使用你想要的任何 Linux 发行版,因为你可以根据你愿意跳过的环环来定制任何 Linux 发行版,使其成为你的录音室。除了 Audacity 和其他音频软件应用之外,你需要最重要的东西是一个实时可抢占的内核以实现最低延迟,以及一些系统配置调整。你可以配置和调整你最喜欢的 Linux 发行版,或者你可以使用专为多媒体制作而设计的专业 Linux 发行版,它会为你处理细节。

在撰写这本书时,我使用了 Ubuntu,因为它是第一个捆绑 FFADO 驱动程序的 FireWire 录音接口的发行版。(我有一个优秀的 Focusrite Saffire Pro 26 I/O 用于多通道录音。)FireWire 录音接口是出色的性能者,但它们带来了一些特殊的驱动程序问题,所以如果你没有,不要担心寻找包含 FFADO 的发行版。无论如何,你都可以稍后添加它。

注意

最重要的一步是仔细选择你的音频接口。选择一个在 Linux 上得到良好支持的接口。生命太短暂,不能浪费在不愿意正常工作的事情上。访问 ALSA 声卡矩阵(www.alsa-project.org/main/index.php/Matrix:Main)以查找受支持的声音卡。还可以查看附录 A 以获取硬件信息。

使用具有实时内核的发行版

如果你的 Linux 发行版打包了实时内核,那么就解决了最大的障碍。什么是实时内核?这是一个配置了实时调度实时抢占的内核,以优先保证音频记录的最小延迟。延迟是计算机固有的,因为现代 CPU 使用抢占式多任务处理;它们一次执行一个任务,但快速地在任务之间切换,以至于看起来它们同时执行多个任务。多核 CPU 平滑了这种切换,但它们仍然需要 Linux 内核的帮助。

由于 Linux 内核以超光速持续发展,有些人说,特殊的实时内核现在其实不再必要,因为实时功能已经集成到主线内核中。如果您将 Linux 系统简化为音频制作所需的基本要素,并使用现代的多核 PC、数 GB 的 RAM 和快速的硬盘驱动器,您就可以不使用它。我目前会坚持使用实时内核,因为它们的行为与通用内核略有不同。

实时抢占控制着任务如何相互中断以获取它们所需的 CPU 时间。这就像一个教室里的孩子们试图引起老师的注意,而老师一次只能处理一个。多核 CPU 就像是拥有更多的老师。中断通常持续数毫秒,当我们正在打字或编辑照片时这并不重要,但足以在录音中引入缺陷。因此,我们可以配置 Linux 将最高调度优先级分配给音频功能。

内核本身的内部工作存在固有的延迟,在现代内核中这些延迟已经变得非常小。因此,可以将 Linux 内核调整为非常低延迟的音频录制,低至 10 毫秒以下。任何低于 20 毫秒的都是优秀的。

Fedora 和 CentOS 用户应使用 Planet CCRMA 包(ccrma.stanford.edu/planetccrma/software/planetccrma.html)。Planet CCRMA(发音为“karma”)是针对 Fedora 和 CentOS 的特殊 RPM 集合,包括实时内核、各种音频软件和最新的音频驱动程序。只需将 Planet CCRMA 仓库添加到您的系统中,然后使用 Yum 以常规方式安装、更新和删除包。

Arch Linux 是一个优越的音频制作平台,它有自己的特殊音频仓库,ArchAudio。Red Hat、Mandriva 和 openSUSE 都打包了实时内核。

Ubuntu(以及 Kubuntu、Xubuntu 和该系列的所有其他版本)提供实时内核和相关内核模块;要开始使用 Audacity 所需的最小包包括这些:

  • audacity

  • linux-rt

一旦安装了 rt 内核,将所有将要使用 Audacity 的人类用户添加到audio组(在/etc/group文件中)。然后向/etc/security/limits.conf文件中添加以下行:

  • @audio - rtprio 99

  • @audio - memlock 3000000

第一行将最高调度优先级赋予音频组的所有成员。第二个值控制内存的使用方式。

  • rtprio(实时优先级)的值从 0 到 99,其中 99 是最高优先级。这是队伍的最前面。

  • memlock 决定了音频组锁定多少 RAM 用于自身,以千字节为单位,并防止它写入较慢的交换文件。我的系统有 4GB RAM,所以我将限制设置为 3GB,即 3,000,000KB。有些指南建议将其设置为 无限制。这有点有争议,因为似乎常识是应该为系统进程和非音频应用程序留出一些空间。无限制的值也可能导致内存不足错误并中断您的音频会话。一些用户报告说设置任何 memlock 值都没有区别。

许多指南还建议添加一行:@audio - nice -19。这并不是必要的,因为 rtprio 函数负责处理调度优先级。自己尝试一下也不会有什么坏处。

然后重新启动到您的新内核。请注意,如果您已经运行了您的 rt 内核,您要激活新的组成员资格和 limits.conf 的更改,只需注销然后重新登录即可。然后验证您的音频组成员资格:

$ groups
carla adm disk dialout cdrom audio plugdev lpadmin admin

确认您的 rt 内核正在运行:

$ uname -r
2.6.32-24-rt

rt 告诉您这是一个实时内核;此示例来自 Ubuntu 10.04。您还应该保留一个库存内核安装。使用不同的内核就像重新启动并从您的引导菜单中选择它一样简单。它还将有助于故障排除,因为您可以使用不同的内核尝试给您带来问题的任务,以查看它们是否表现不同。

专业的多媒体 Linux 发行版

有几个完整的 Linux 发行版是为音频和多媒体制作定制的。其中一些可以从 CD、DVD 或 USB 棒运行,并提供硬盘安装选项。您仍然应该验证音频组成员资格、/etc/security/limits.conf 设置以及我们在上一节中讨论的实时内核。

这里是一些专业的多媒体 Linux 发行版的样本:

64 Studio

64 Studio 是一个基于 Debian 的发行版,适用于所有数字内容创作,它包括大量的音频、视频、图形和出版软件。它支持 32 位和 64 位架构,并在广泛的 PC 硬件上运行。维护者追求稳定性而不是尖端技术,因此他们保守地发布更新。64 Studio 还构建并支持诸如 Trinity Indamixx 数字音频工作站和 Lionstracs Mediastation 等产品。

Ubuntu Studio

Ubuntu Studio 与 64 Studio 类似,拥有几乎所有 Linux 多媒体应用程序,但它基于 Ubuntu,而 Ubuntu 又源自 Debian。Ubuntu 不仅仅是 Debian 的翻版;Ubuntu 开发团队维护自己的补丁和定制。Ubuntu Studio 使用比 64 Studio 更新的软件包,因此你将获得更新的软件版本,也许还有新的错误。与所有 Ubuntu 一样,它有一个庞大且热情的用户基础和良好的社区支持。

你还可以将 Ubuntu Studio 软件包添加到常规的 Ubuntu 系统中。运行 $ apt-cache search ubuntustudio 来查看你的选项。ubuntustudio-audioubuntustudio-audio-plugins 元软件包应该会为你提供音频制作所需的一切,但有一个重要的例外:linux-rt 内核不包括在内,因此你将不得不单独安装它。

dyne:bolic

dyne:bolic 是一个独特的软件项目。dyne:bolic 不是基于任何其他 Linux 发行版,而是从头开始从源代码构建的。这只是开始——dyne:bolic 以其独特的方式进行操作。它只使用自由软件基金会定义的免费软件。这对希望使用不受专有软件束缚的系统用户来说是个好消息。它可以从 CD 运行,并且针对速度和低硬件要求进行了优化,至少需要一台 Pentium II 400 MHz 的计算机或一个 Xbox 游戏机。你可以使用 Linux 或 Windows PC,你可以将你的数据保存到 USB 棒或本地硬盘上,并且它还提供了硬盘安装选项。定制不像使用 Yum 或 Apt 安装新软件包那样简单,因为你必须构建一个新的 CD 映像。它附带良好的文档和友好的用户社区。

dyne:bolic 是 Rasta (www.rastasoft.org/) 软件。Jaromil,dyne:bolic 的主要开发者,说道:

但请记住,没有正义就没有和平。这款软件是关于在巴比伦世界中抵抗的,它试图越来越多地控制我们沟通和分享信息与知识的方式。这款软件是为那些负担不起最新昂贵硬件来发表他们意识之言和善意的人准备的。这款软件拥有从信息生产到消费的全套应用,它是一个完整的多媒体工作室,并且不输给其他任何专有系统,因为自由和知识共享是进化的坚实基础,这也是这款软件的来源。

pure:dyne

pure:dyne 最初基于 dyne:bolic,但已演变成 Ubuntu 和 Debian 的混合体。它可以从 CD、DVD、USB 棒或硬盘安装运行。它比 dyne:bolic 更新,并且针对现代 i686 处理器进行了优化,尽管它也可以在旧硬件上运行。它旨在可由用户自定义,并附带创建定制映像的工具。

Musix

Musix 是基于 Debian 的,适用于 32 位系统。它提供 Live CD 或 Live DVD,还有硬盘安装选项。Musix 也是一个 100%免费的操作系统。它提供了一个基于 IceWM 和出色的 Rox 文件管理器的轻量级桌面环境,因此适合硬件配置较低的计算机。

构建实时内核

如果你不想使用多媒体 Linux 发行版,而你喜欢的发行版没有打包实时内核,你可以自己构建。一个完整的内核构建指南将是一个完整的章节,所以我不打算在这个章节中尝试塞入一个。你可以轻松找到好的指南;寻找针对你发行版的特定说明。

你需要安装适当的构建环境、内核源代码以及当前内核的配置文件副本。一旦这些就位,你需要 rt 补丁,可以从 Linux 内核的母体网站www.kernel.org/获取。访问 rt wiki(rt.wiki.kernel.org/index.php/Main_Page),寻找“CONFIG_PREEMPT_RT Patch”下载。它必须与你的内核源代码版本相同。一旦你有了它,就将其应用到你的内核源代码上。

在你的内核 makefile 中,将EXTRAVERSION设置为表示这是一个实时内核的值,例如EXTRAVERSION = -rt。然后,如果你的内核版本是 2.6.33.1,例如,你的新内核名称将是 linux-2.6.33.1-rt。

现在,你已经准备好配置你的新内核了。从现有的内核配置开始,运行make oldconfig命令;你不需要从头开始配置,只是为了启用实时抢占。检查你的内核配置,并启用处理器类型和功能 > 抢占模式(完全抢占(实时)),以及处理器类型和功能 > 定时器频率(1000 Hz)。

然后完成配置,编译并安装你的新内核。这应该就是全部了,但请查看 rt wiki 以确保无误,因为 Linux 内核开发是一个快速发展的目标。同时也要保留你的旧版内核。你可以在系统上安装任意数量的内核,如果出现任何问题,你将有一个好的内核可以启动。

延迟并不可怕

延迟并不是像有时被描述的那样可怕。处理延迟的一种方法是将马力投入其中。现代的多核 CPU、千兆内存和快速的硬盘可以使延迟几乎消失。

如果没有其他选择,了解何时延迟真正是问题,何时不是,会有所帮助。当你进行多轨录音时,这很重要。即使在这里,Audacity 也能帮助你,因为它在编辑 > 首选项 > 录音对话框中有一个可配置的延迟校正功能。(参见第十二章了解如何测量和校正延迟。)当你通过电脑上的特殊效果插件播放软件合成器或任何乐器时,这也很重要:当你按下键或弹拨琴弦时,你希望音乐响起,而不是延迟。当你监控录音会话时,这也很重要,因为你不希望听到的声音与实际不符。

编辑 > 首选项 > 录音对话框中,有一个影响延迟的设置,称为“音频到缓冲区”。缓冲区越小,延迟越低,但如果它们对于你的 CPU 来说太小,你将遇到断点。

在混音或多声道录音期间,延迟并不那么重要,因为所有东西都连接到一个好的录音接口,该接口直接连接到 Audacity 而没有绕路。拥有一个稳定且不会在录音会话中途崩溃的设置更为重要。如果你可以接受更高的延迟以换取稳定性,那是一个很好的交易。将延迟水平降低到不稳定是不好的。

当你运行一个干净的系统,除了音频制作所需之外,所有东西都关闭时,中断问题就小得多。(参见 Linux 系统调整中的 Linux 系统调整。)

JACK,即 Jack 音频连接套件,有自己的延迟和缓冲区大小配置选项,你可以在使用 Audacity 与 JACK 中详细了解这些选项。(参见使用 Audacity 与 JACK。)

整理 Linux 音频

在这本书中,我们使用 Audacity 配合 ALSA 和 JACK。不使用 PulseAudio、OSS、aRts、ESD 或其他可能潜伏在草丛中的任何东西。

几年来,Linux 音频领域一直很复杂,有多个子系统重叠的功能,现在它正在经历一些重大变化。没有单一的 Linux 音频 API 供开发者针对,而是他们必须处理一群音频服务器和子系统:开放声音系统(OSS)、高级 Linux 声音架构(ALSA)、Gnome 上的启蒙声音守护进程(ESD)、KDE2/3 的模拟实时合成器(aRts)、KDE4 的 Phonon、PulseAudio 和 JACK 音频连接套件。

ESD 和 aRts 正在进入退休,这使群体稍微减少了一些,留下了在任意 Unix 类型操作系统上运行的 PulseAudio(用于控制播放),Phonon(KDE4)以及用于专业音频制作的 JACK。ALSA 为所有这些提供了一个共同的驱动程序基础,它直接与音频硬件交互,并且还提供了一套有用的用户工具,例如混音器、设备发现、简单的播放器和录音机,以及扬声器测试器。PulseAudio 正在进入许多 Linux 发行版,如 Ubuntu 和 Fedora,看起来它将成为主流桌面音频服务器。

PulseAudio 是一个声音守护进程,而 Phonon 是一个支持多个音频框架的多媒体 API,包括 PulseAudio。PulseAudio 和 Phonon 提供播放混音器和路由器以及网络声音。许多 Linux 应用程序没有音频设备选择器。例如,Firefox 网络浏览器只使用默认音频设备。PulseAudio 和 Phonon 让您控制 Firefox 使用哪个音频设备。当我使用 Audacity 时,我喜欢关闭 PulseAudio;关闭 PulseAudio 和 Phonon 中的关闭 PulseAudio 和 Phonon 会告诉您如何操作。

那么,OSS 怎么样?有些人更喜欢它,您可以尝试一下。ALSA 在 Linux 中支持得更好,它包括为希望使用 OSS 的应用程序提供的 OSS 模拟。

注意

Adobe Flash Player 音乐播放器存在错误和不稳定的问题。例如,Pandora Radio,这个出色的在线音乐广播电台,完全依赖于 Flash。这是一个伟大的服务,我很高兴成为付费订阅者。但是 Flash Player 是一个持续的问题来源。它定期失去与音频系统的连接,并且不喜欢设备路由的变化,例如从电脑扬声器切换到外部声音系统时。当它出现问题时,需要刷新浏览器或重新启动才能再次启动。如果您需要用于测试的音频源,您应该寻找其他选项。

JACK 是一个专业质量、低延迟(意味着它不会向您的声音链添加延迟)的音频服务器,用于将音频硬件连接到音频生产软件。JACK 不独立运行,但需要alsa-base。JACK 支持多个音频后端:OSS;FFADO(以前称为 Freebob)用于在 Linux 上使用 FireWire 录音接口;PortAudio,这是一个简单的跨平台音频 API;以及 CoreAudio,Mac OS X 音频 API。Audacity 使用 PortAudio。

让我们澄清一些关于 PulseAudio 和 JACK 的常见误解。它们针对两种不同的使用场景:PulseAudio 是一个设备选择器和音频流路由器,用于播放和录音,而 JACK 是一个高端音频生产的音频路由器。JACK 允许你以几乎任何你想要的方式路由多个音频应用程序的输出,因此你可以以不同的方式组合不同的合成器并捕获音频流进行录音。尽管 PulseAudio 在成熟的过程中这两个问题都在改善,但它对 CPU 的消耗很大,并且为叠加和其他对延迟敏感的任务创建了过多的延迟。它适用于制作简单的录音,Audacity 和 JACK 都支持 PulseAudio。你需要 pulseaudio-module-jack 插件来支持 JACK,这个插件应该包含在你的发行版仓库中。

你何时使用 JACK?如果你的录音接口处理了录音会话所需的所有连接,你不需要它。如果所有设备都连接到单个录音接口,只需将 Audacity 指向它即可。尽管如此,JACK 仍然可以通过提供灵活的路由选项来帮助你,让你以不同的方式混合音频流,并调整性能。

当你使用 FireWire 录音接口时,你需要 JACK。当你想要将软件音频应用程序集成到 Audacity 录音会话中时,也需要它。(尽管 Audacity 不支持 MIDI,但 JACK 对 MIDI 有很好的支持。)一个简单的例子,我们将在使用 Audacity 与 JACK(使用 Audacity 与 JACK)中详细说明,是将优秀的 Hydrogen 软件鼓机添加到 Audacity 录音会话中。如果你想用 Hydrogen 在 Audacity 中创建鼓轨,你需要 JACK 来连接这两个应用程序。

使用 ALSA

ALSA 由两部分组成:低级基础部分,提供声卡驱动程序并与音频硬件直接交互,以及一个高级接口,包含用户空间工具。alsa-base及其依赖项应该已经存在,但你可能需要安装alsa-utils来获取用户空间工具。alsa-utils为你提供了alsamixer, aplay, speaker-test, arecord以及用于测试扬声器的多个声音文件。

打开终端并输入alsamixer以打开混音控制台,如图图 13-1 所示。ALSA 通过 ncurses 界面在控制台运行,这意味着它是完全键盘控制的,不需要 X 服务器。左上角的标题告诉你很多有用的信息:你的声卡和芯片组,你正在查看的功能集,以及高亮设置的值。使用箭头键前后导航。有三个视图:播放、捕获和全部。按 Tab 键在它们之间切换。按 Esc 键关闭alsamixer

使用 alsamixer 配置板载环绕声。在我的系统中,所有模块都必须处于活动状态——环绕、中心、LFE 和侧面——才能使立体声工作,尽管它们的音量控制没有效果。

图 13-1. 使用alsamixer配置板载环绕声。在我的系统中,所有模块都必须处于活动状态——环绕、中心、LFE 和侧面——才能使立体声工作,尽管它们的音量控制没有效果。

按下 F2 键,可以看到所有检测到的音频设备的详细信息,如图图 13-2 所示。注意,它们从零开始编号。使用箭头键上下滚动,并按回车键关闭信息窗口。

alsamixer 查询/proc 文件系统以显示音频设备的详细信息。

图 13-2. alsamixer查询/proc文件系统以显示音频设备的详细信息。

图 13-3 显示了播放配置屏幕。

alsamixer 播放屏幕控制播放设备的静音和音量。

图 13-3. alsamixer播放屏幕控制播放设备的静音和音量。

在 alsamixer 中设置录音和播放级别

alsamixer仅显示您的声卡能够执行的功能。以下是基本的alsamixer命令:

  • 播放菜单中带有 MM 的小方块表示这些功能被静音或禁用。切换 M 键以静音/取消静音,MM 变为 00。

  • 00 表示静音,因此请使用上下箭头键调整它。Page Up 增加音量 5,Page Down 减少音量 5,End 将音量设置为 0。

  • 当一个滑块上有两个通道时,你可以独立调整每个通道。Q 增加左通道,Z 减少它。E 增加右通道,C 减少它。

  • 在捕获屏幕上,按空格键选择活动录音(捕获)设备。可能有超过两个选项,所以按几次以查看你的选择。

  • 按 F1 键查看帮助菜单。按 F2 显示你的/proc信息,它显示实际检测和工作的内容,以及设备地址。

有时你会遇到由启用不必要的功能引起的静电或音量太低的情况。例如,我的 ATI 板载声卡的播放屏幕显示一个前置麦克风音量控制。当这个功能被启用时,会导致静电。当我使用耳机时,耳机控制需要打开,但改变音量级别几乎没有效果,我需要使用主控和 PCM 音量控制。主控音量控制对于扬声器不是必需的,但耳机控制是。试错是找出这些事情的唯一方法,低端声卡比高质量声卡更麻烦和古怪。

主控与 PCM

在主控和 PCM 播放设置上常常存在混淆。你通常需要主控和 PCM 才能启用播放,尽管有时只有 PCM 滑块有影响。如果主控滑块没有效果,这意味着你的声卡中可能没有内置硬件音量控制,或者你的声卡驱动程序缺少此功能。主控是主音量控制,PCM 代表脉冲编码调制。记住音频文件格式和质量设置在最终混音中,我们学习了将模拟信号转换为数字表示的方法?ALSA 对 PCM 的定义为我们解决了这个问题:

虽然 PCM 的缩写代表“脉冲编码调制”,但我们理解它为在连续时间段内生成音量样本的通用数字音频处理。

所以把 ALSA 的 PCM 通道想象成一个虚拟声卡。

多个声卡

如果你有一个以上的音频接口,alsamixer从零开始编号。例如,我既有板载声卡也有 M-Audio MobilePre 连接到 USB 端口。MobilePre 是#1,所以为了控制它,我需要用以下命令打开alsamixer

$ alsamixer -c1

-c1意味着“卡号 1”。你怎么知道你的卡号是多少?一种方法是通过查询/proc

$ cat /proc/asound/cards

 0 SB             : HDA-Intel - HDA ATI SB
                      HDA ATI SB at 0xf9ff4000 irq 16
 1 MobilePre      : USB-Audio - MobilePre
                      M Audio MobilePre at usb-0000:00:12.1-1, full speed

另一种方法是按alsamixer中的 F2(图 13-2)。

调整音量级别

当你在 Audacity 中调整录音和播放设置时,你可以同时打开 alsamixer,如图 13-4 所示。这是一种快速调整音量设置并了解 alsamixer 设置实际控制什么的方法。在这个例子中,一些尝试和错误让我发现麦克风增益和第一个捕获滑块控制麦克风录音音量,并且这张声卡有一个真正的立体声麦克风输入,具有两个通道。(记住,Q 和 Z 键提升和降低左通道的音量,而 E 和 C 控制右通道。)

alsamixer 捕获窗口控制录音设备上的设备选择和音量。这里它与 Audacity 并排,用于控制录音音量级别。

图 13-4。alsamixer 捕获窗口控制录音设备上的设备选择和音量。这里它与 Audacity 并排,用于控制录音音量级别。

即使在这样的简单设置中,也有多个录音电平控制,包括 ALSA 和 Audacity。在录音期间保持 alsamixer 打开以进行调整。

注意

如果你需要一个很好的理由来购买双显示器设置,音频制作是一个很好的理由。你可以在一个屏幕上运行 Audacity、JACK 和 alsamixer,而在第二个屏幕上运行你的其他音频应用程序(如 Hydrogen、其他合成器、特殊效果)。既整洁又方便,你不必总是移动东西。

使用 alsa-utils 进行硬件测试

alsa-utils 包含一些有用的命令,可以帮助你排除硬件故障并进行测试。在测试声卡时保持 alsamixer 打开,这样你可以快速尝试不同的设置。没有声音的最常见原因是它在 alsamixer 中被静音了。

注意

如果你正在运行 JACK 音频服务器,请关闭它进行这些测试,因为这些命令在 JACK 运行时可能不起作用。在任何情况下,最好尽可能简化测试。

这是一种快速且令人烦恼的验证默认声卡和扬声器是否正常工作的方法。它应该生成一些白噪声:

$ cat /dev/urandom > /dev/dsp

按下 ctrl-C 可以停止它。一种更优雅的方法是使用 aplay 播放你选择的 WAV 文件,如下所示:

$ aplay -t wav violin-summit.wav

-t 表示“文件类型”,你的选择有 vocwavrawauwav 是默认选项。

要查看 PCM 结构和漂亮的 ASCII VU(音量单位)表,请尝试以下操作:

$ aplay -vv -t wav -V stereo violin-summit.wav
Playing WAVE 'violin-summit.wav' : Signed 16 bit Little Endian, Rate 44100 Hz, Stereo
Plug PCM: Soft volume PCM
Control: PCM Playback Volume
min_dB: -51
max_dB: 0
resolution: 256
Its setup is:
  stream : PLAYBACK
  access : RW_INTERLEAVED
  format : S16_LE
  subformat : STD
  channels : 2
  rate : 44100
  exact rate : 44100 (44100/1)
  msbits : 16
  buffer_size : 16384
  period_size : 4096
  period_time : 92879
  tstamp_mode : NONE
  period_step : 1
  avail_min : 4096
  period_event : 0
  start_threshold : 16384
  stop_threshold : 16384
  silence_threshold: 0
  silence_size : 0
  boundary : 4611686018427387904
        +############### 46%|48%################+

-V stereo 表示“显示立体声 VU 表”,它由井号标记表示。这些代表均方根(RMS)音量水平(即时间上的平均音量),百分比值是峰值。你可以看到这是一个立体声 CD 质量文件,或者 2 通道 16 位 44.1 kHz。

如果你有多于一个声卡怎么办?使用 aplay -l 显示所有音频接口的原始 ALSA 设备信息:

$ aplay -l
**** List of PLAYBACK Hardware Devices ****
card 0: SB [HDA ATI SB], device 0: VT1708S Analog VT1708S Analog
  Subdevices: 2/2
  Subdevice #0: subdevice #0
  Subdevice #1: subdevice #1
card 0: SB HDA ATI SB, device 1: VT1708S Digital VT1708S Digital
  Subdevices: 1/1
  Subdevice #0: subdevice #0
card 1: MobilePre MobilePre, device 0: USB Audio USB Audio
  Subdevices: 0/1
  Subdevice #0: subdevice #0

ALSA 设备的命名格式为 interface:card,device。声卡从零开始编号。ALSA 接口是一个 PCM 播放或录音设备、一个 MIDI 设备,或者是一个控制设备,如混音器。hw 接口直接与内核通信,因此这是测试你的音频硬件的最直接方式。以下示例将一个 WAV 文件发送到第一个 ALSA 接口,即 hw:0,0 的 ATI SB 板载声卡:

$ aplay -vv -t wav -D hw:0,0 angeline-the-baker.wav

有时你会看到这样的错误信息:“警告:速率不准确(请求 = 44100Hz,得到 = 48000Hz),请尝试使用 plug 插件。” 这意味着用 plughw 替换 hw

$ aplay -vv -t wav -D plughw:0,0 angeline-the-baker.wav

hw 不进行任何转换——把它看作你的直接播放设备。它只能做硬件支持的事情,所以某些音频文件可能听起来很奇怪或者根本无法播放。plughw 是一个特殊的 ALSA 插件,类似于 hw 但拥有额外的功能;它可以执行播放你的文件所需的任何转换。aplay 只支持 vocwavrawau,所以你最好坚持使用 WAV 文件。

这个例子在第二个 ALSA 设备上播放文件,在这个例子中是 MobilePre:

$ aplay -vv -t wav -D hw:1,0 angeline-the-baker.wav

如果有第三个音频接口,它将是 hw:2,0

测试扬声器

speaker-test 命令可以帮助你确定你的扬声器是否按正确的顺序连接。以下示例测试了两通道立体声:

$ speaker-test -t wav -D hw:0,0 -c2 -l1

speaker-test 1.0.20

Playback device is hw:0,0
Stream parameters are 48000Hz, S16_LE, 2 channels
WAV file(s)
Rate set to 48000Hz (requested 48000Hz)
Buffer size range from 64 to 16384
Period size range from 32 to 8192
Using max buffer size 16384
Periods = 4
was set period_size = 4096
was set buffer_size = 16384
 0 - Front Left
 1 - Front Right
Time per period = 2.732753

你应该听到一位愉快的女士的声音说:“前左,前右。” -c2 表示两个通道,-l1 表示只运行一次测试。

这个芯片组支持 5:1 环绕声,所以你也可以测试这个:

$ speaker-test -t wav -D hw:0,0 -c6 -l1

speaker-test 1.0.20

Playback device is hw:0,0
Stream parameters are 48000Hz, S16_LE, 6 channels
Rate set to 48000Hz (requested 48000Hz)
Buffer size range from 6 to 5461
Period size range from 3 to 2730
Using max buffer size 5460
Periods = 4
was set period_size = 1365
was set buffer_size = 5460

 0 - Front Left
 4 - Center
 1 - Front Right
 3 - Rear Right
 2 - Rear Left
 5 - LFE
Time per period = 17.801733

你可以使用 -s 选项测试单个扬声器,如下例测试中置扬声器通道:

$ speaker-test -t wav -D hw:0,0 -c6 -s5 -l1

speaker-test 1.0.20

Playback device is hw:0,0
Stream parameters are 48000Hz, S16_LE, 6 channels
WAV file(s)
Rate set to 48000Hz (requested 48000Hz)
Buffer size range from 6 to 5461
Period size range from 3 to 2730
Using max buffer size 5460
Periods = 4
was set period_size = 1365
was set buffer_size = 5460
  - Center

注意这个巧妙的陷阱:speaker-test 输出从零开始编号扬声器,但对于 -s 选项,你必须从 1 开始。

-t wav 使用包含的默认 WAV 测试文件;你也可以尝试 pink,它生成粉红噪声,以及 sine,它听起来像老式电视测试屏幕上的正弦波音调。(现在它们使用电视购物节目。我想念测试屏幕。)你可以指定与 sine 选项一起使用的不同频率(以 Hz 为单位),如下例使用 45 Hz 的低音调测试低音炮:

$ speaker-test -t sine -f 45 -D hw:0,0 -c6 -s6

LFE 表示低频效果通道或低频发射器。这是处理 3 到 200 Hz 范围内低音的通道。这不同于你将低音炮插入的物理端口,因为 LFE 信号可以被路由到任何支持它的扬声器或扬声器组。

测试录音

aplay 有一个配套命令 arecord。记得检查 alsamixer 以获取正确的设置,例如捕获设备和音量控制。如果你的电脑有前后麦克风端口,alsamixer 应该有一个选项来选择正确的端口。在这个例子中,检测到两个音频设备:

$ arecord -l
**** List of CAPTURE Hardware Devices ****
card 0: SB HDA ATI SB, device 0: VT1708S Analog VT1708S Analog
  Subdevices: 2/2
  Subdevice #0: subdevice #0
  Subdevice #1: subdevice #1
card 1: MobilePre MobilePre, device 0: USB Audio USB Audio
  Subdevices: 1/1
  Subdevice #0: subdevice #0

这个例子使用 MobilePre 进行测试录音:

$ arecord -vv -fcd -V stereo -D hw:1,0 test.wav
Recording WAVE 'test.wav' : Signed 16 bit Little Endian, Rate 44100 Hz, Stereo
Hardware PCM card 1 'MobilePre' device 0 subdevice 0
Its setup is:
  stream       : CAPTURE
  access       : RW_INTERLEAVED
  format       : S16_LE
  subformat    : STD
  channels     : 2
  rate         : 44100
  exact rate   : 44100 (44100/1)
  msbits       : 16
  buffer_size  : 22050
  period_size  : 5513
  period_time  : 125011
  tstamp_mode  : NONE
  period_step  : 1
  avail_min    : 5513
  period_event : 0
  start_threshold  : 1
  stop_threshold   : 22050
  silence_threshold: 0
  silence_size : 0
  boundary     : 6206523236469964800
  appl_ptr     : 0
  hw_ptr       : 0
                   +############## 43%|34%###########+

ctrl-C 停止录音。-fcd 表示 CD 质量,即 2 通道 16 位 44.1 kHz。aplay 播放测试录音:

$ aplay -vv -t wav -V stereo -D hw:1,0 test.wav

ALSA 应用程序

ALSA 为你的声卡创建了许多虚拟接口,称为 应用程序。你可以使用 aplay 查看:

$ aplay -L
default:CARD=SB
    HDA ATI SB, VT1708S Analog
    Default Audio Device
front:CARD=SB,DEV=0
    HDA ATI SB, VT1708S Analog
    Front speakers
surround40:CARD=SB,DEV=0
    HDA ATI SB, VT1708S Analog
    4.0 Surround output to Front and Rear speakers
surround41:CARD=SB,DEV=0
    HDA ATI SB, VT1708S Analog
    4.1 Surround output to Front, Rear and Subwoofer speakers
surround50:CARD=SB,DEV=0
    HDA ATI SB, VT1708S Analog
    5.0 Surround output to Front, Center and Rear speakers
surround51:CARD=SB,DEV=0
    HDA ATI SB, VT1708S Analog
    5.1 Surround output to Front, Center, Rear and Subwoofer speakers
surround71:CARD=SB,DEV=0
    HDA ATI SB, VT1708S Analog
    7.1 Surround output to Front, Center, Side, Rear and Woofer speakers
iec958:CARD=SB,DEV=0
    HDA ATI SB, VT1708S Digital
    IEC958 (S/PDIF) Digital Audio Output
null
    Discard all samples (playback) or generate zero samples (capture)

这有很多应用程序!在普通使用中,这些对用户或向 ALSA 发送声音流的应用程序来说并不重要,因为所有的事情都在幕后处理。你可以像测试 hw 接口一样测试这些:

$ speaker-test -t wav -D default:CARD=SB -c2 -l1

$ speaker-test -t wav -D surround71:CARD=SB,DEV=0 -c8 -l1

$ aplay -vv -D surround51:CARD=SB,DEV=0 madbanjos.wav

在我的系统中,aplay 为 MobilePre 返回了相同的应用程序集合,即使它不支持环绕声,只有双声道立体声。所以,这是有效的:

$ speaker-test -t wav -D front:CARD=MobilePre,DEV=0 -c2 -l1

但这并不:

$ speaker-test -t wav -D surround51:CARD=MobilePre,DEV=0 -c6 -l1
Stream parameters are 48000Hz, S16_LE, 6 channels
WAV file(s)
Broken configuration for playback: no configurations available: Invalid argument
Setting of hwparams failed: Invalid argument

查询你的声卡

你如何知道你的声卡有什么能力,它支持哪些位深度和采样率,以及有多少通道?如果你没有手册,你可以查询 /proc 文件系统来找出这些信息。音频设备位于 /proc/asound。你可以使用任何文件管理器或从命令行浏览这个目录。例如,在我的系统中 /proc/asound/card0 是集成在主板上的 ATI 芯片组。读取 /proc/asound/card0/codec#0 会输出大量信息,这个片段显示这个芯片组支持高采样率和位深度:

$ less /proc/asound/card0/codec#0
    rates [0x5e0]: 44100 48000 88200 96000 192000
    bits [0xe]: 16 20 24

MobilePre 看起来是这样的:

$ less /proc/asound/card1/stream0
M Audio MobilePre at usb-0000:00:12.1-1, full speed : USB Audio

Playback:
  Status: Stop
  Interface 1
    Altset 1
    Format: 0x2 (16 bits)
    Channels: 2
    Endpoint: 3 OUT (ADAPTIVE)
    Rates: 8000, 9600, 11025, 12000, 16000, 22050, 24000, 32000, 44100, 48000

Capture:
  Status: Stop
  Interface 2
    Altset 1
    Format: 0x2 (16 bits)
    Channels: 2
    Endpoint: 5 IN (SYNC)
    Rates: 8000, 9600, 11025, 12000, 16000, 22050, 24000, 32000, 44100, 48000

我是如何知道该读取哪些 /proc 文件的呢?我试了所有的。不要尝试编辑 /proc 文件。/proc 是一个仅存在于内存中的伪文件系统,显示内核和操作系统的当前状态。

使用 JACK 与 Audacity

JACK 音频连接套件是一个了不起的创造。它的原始创造者是 Paul Davis,现在 Davis 先生和一支开发团队支持 JACK。它是一个专业质量、低延迟的音效服务器,适用于 Linux 和任何 POSIX 兼容的操作系统,如 Mac OS X、Solaris、AIX、HP-UX 和 IRIX。目前它在 Linux、Mac OS X 和 FreeBSD 上运行良好。

注意

当你使用 Audacity 时,Phonon(在 KDE4 中)不会妨碍你,但 Pulse-Audio 经常会,所以请参阅 关闭 PulseAudio 和 Phonon 来了解如何禁用它。

JACK 就像一个交换机,可以在你的音频硬件和软件之间路由音频信号,而不会增加延迟。JACK 一次只能与一张声卡接口,但它可以与任何数量的软件音频制作应用程序接口,只要它们是 JACK 感知的。如果你有一个控制所有音频源的硬件设备,那么你不需要 JACK。例如,在我的小型录音室里,我的 MobilePre 可以处理多达 4 个输入,而 Saffire Pro 可以处理多达 26 个。如果我想录制的所有设备都连接到这些设备之一,我就不需要 JACK。但是,假设我想使用 Hydrogen,Linux 的软件鼓组?这是一个出色的、有趣的鼓合成器,大多数发行版仓库中都有,还附带了一系列演示,我可以立即开始使用它。我该如何将 Hydrogen 连接到 Audacity?这就是 JACK 发挥作用的地方。

你启动各种应用程序的顺序很重要。首先让所有东西都运行并连接到 JACK,然后 Audacity 总是最后一个启动。看起来我们可以在 JACK 运行后打开 Audacity,将其连接到 JACK,然后运行我们想要的任何其他东西。有时这可以工作,因为 JACK 会动态更新新的连接。但 Audacity 可能会很挑剔,所以我先启动其他所有东西。通常第一次尝试一切都会正常工作,但有时 Audacity 会抛出一个错误消息,关于错误的音频设备或其他不愉快的事情。关闭并重新打开它通常可以解决这个问题。

让我们使用 MobilePre,因为它简单易用。它连接了两个麦克风,用于声乐和吉他,然后我们将添加一个不错的鼓轨。首先关闭所有其他音频应用程序,然后启动 JACK。JACK 可以从命令行或 Qjackctl 图形界面运行。我们将使用 Qjackctl,它应该出现在你的系统菜单中,作为 JACK 控制(图 13-5)。

Qjackctl,图形 JACK 控制器

图 13-5. Qjackctl,图形 JACK 控制器

如果你打开 Qjackctl 时 JACK 启动了,请停止它,然后点击设置按钮。你会看到一个配置对话框,类似于图 13-6。

在 Qjackctl 设置对话框中选择你的音频设备并配置 JACK

图 13-6. 在 Qjackctl 设置对话框中选择你的音频设备并配置 JACK

  1. 如果你使用的是实时内核,请在“参数”列中检查“实时”选项。否则,不要勾选。

  2. 如果你的录音接口上有监控端口,请勾选“H/W Monitor”以启用它。将第一列中的其他所有选项保持未勾选。

  3. 在下一列中,将优先级保留为(默认)。

  4. 将帧/时期保持在默认的 1024。

  5. 设置您的采样率,并确保它与 Audacity、Hydrogen 和您正在运行的任何其他音频软件相匹配。它必须是您的录音接口支持的速率。

  6. 时期/缓冲区默认为 2;目前先保持这个设置。

  7. 将端口最大值和超时时间分别保持在它们的默认值 256 和 500。

  8. 在第三列,选择“alsa”作为驱动程序。

  9. 选择您的输入和输出设备;点击右侧的小箭头以显示所有声音设备。

  10. 设置输入和输出通道的数量,这些数量取决于您的音频接口支持的数量。MobilePre 的输入和输出都有两个通道。

  11. 点击确定,然后点击开始按钮。启动时看到一些 xruns 是正常的。点击消息和状态按钮以显示有关您的 JACK 会话所需了解的一切,无论是好是坏。

现在启动 Hydrogen。图 13-7 显示了 Hydrogen 的外观。

优秀的 Hydrogen 鼓合成器

图 13-7. 优秀的 Hydrogen 鼓合成器

Hydrogen,像许多优秀的 Linux 合成器一样,允许您选择要使用的音频接口和音频后端。进入工具 > 首选项 > 音频系统并选择 JACK。确保“连接到默认输出对”选项未被勾选(图 13-8)。

现在转到项目 > 打开演示并选择一个演示来播放。点击(快进按钮右侧的)循环歌曲按钮,在您测试时保持其播放。

接下来,在 Qjackctl 中点击连接按钮。图 13-9 是结果。系统客户端是 MobilePre 通道;系统客户端始终代表您的音频接口,当然 Hydrogen 被标记为 Hydrogen。您应该在 JACK 中选择的播放设备上听到鼓点。如果您没有听到,将两个 Hydrogen 输出端口连接到两个系统播放端口。您将看到连接它们的线条。

在 JACK 的设置对话框中配置您的播放设备,无论是耳机、外接扬声器还是其他设备。

配置 Hydrogen 使用 JACK

图 13-8. 配置 Hydrogen 使用 JACK

JACK 和 Hydrogen 正在运行,连接窗口显示 Hydrogen 已连接到您的音频接口的播放端口。

图 13-9. JACK 和 Hydrogen 正在运行,连接窗口显示 Hydrogen 已连接到您的音频接口的播放端口。

现在打开 Audacity。将 Audacity 配置为使用 JACK 音频连接套件:Hydrogen 作为录制设备,并按下录制按钮。你应该会看到类似图 13-10 的内容。

Audacity 正在通过 JACK 录制 Hydrogen 鼓轨。

图 13-10. Audacity 正在通过 JACK 录制 Hydrogen 鼓轨。

哇!Audacity 正在录制 Hydrogen!现在 JACK 连接窗口显示了两个新的 PortAudio 客户端,它们是 Audacity 的录制输入(图 13-11

图 13-11. JACK 连接 Hydrogen 和 MobilePre 到 Audacity。Audacity 由两个 PortAudio 客户端表示。在这个例子中,Hydrogen 通过两个 PortAudio 客户端进行录制,并同时通过两个系统播放端口回放。

通常,连接窗口会打开时带有必要的连接,并且根据需要动态创建新的连接。如果它没有打开或者你想更改它们,只需点击一个可读客户端,然后点击一个可写客户端,然后点击连接按钮(或断开连接)。你可以为每个客户端创建多个连接。

MobilePre 是一个支持多达四个输入的双通道录制接口,所以当我通过麦克风录制东西时,它进入与 Hydrogen 鼓轨相同的两个通道立体声轨道。

在 Audacity 和 JACK 的一些较旧版本中,录制设备选择并不一致。有时选择 JACK 音频连接套件:系统有效,有时我必须使用 JACK 音频连接套件:其他,这取决于我正在使用什么。所以,你可能需要尝试一些试错。

连接 FireWire 录制接口

图 13-12 展示了使用 Saffire Pro 与 JACK 和 Audacity 的一个简单示例。您需要 Linux 的 ffado 驱动程序(www.ffado.org/)来使用 FireWire 录音接口,计算机上的 FireWire 适配器以及正确的电缆来连接您的 FireWire 设备。有两种不同的 FireWire 插头,4 针和 6 针,您必须使用与您的设备匹配的插头。

Focusrite Saffire Pro I/O 26 的 ffado-mixer

图 13-12. Focusrite Saffire Pro I/O 26 的 ffado-mixer

这就是我如何让 Saffire Pro 在这个示例中工作。首先我打开了与 ffado 驱动程序一起提供的 ffado-mixer (图 13-12)。

然后,我启动了 Qjackctl,打开设置对话框,将驱动程序更改为“firewire”,并将接口更改为 hw:0。然后我打开了 Hydrogen,将其设置为使用 JACK 作为音频后端,并开始播放演示循环。Saffire 有耳机监听端口,所以我将耳机插入适当的端口,并在 JACK 连接器中创建连接,将 Hydrogen 的回放路由到前两个 Saffire 输入端口,System playback_1 和 playback_2。

然后我最后打开了 Audacity。我确保在 ffado-mixer、JACK 和 Audacity 中采样率相同,并将 Audacity 配置为录制四轨,使用录音设备 JACK Audio Connection Kit:系统。

图 13-13 展示了这一切的样子:有四个 PortAudio 客户端,这意味着 Audacity 中打开了四个录音通道。Hydrogen 使用其中的两个,而我将两个麦克风插入到 Saffire Pro 中,用于其他两个通道的录音。

一切正常:Hydrogen 既能录音也能回放。两个麦克风插入到 Saffire Pro 中,从 Capture 3 和 4 录制到 PortAudio 16 和 17。

图 13-13. 一切正常:Hydrogen 既能录音也能回放。两个麦克风插入到 Saffire Pro 中,从 Capture 3 和 4 录制到 PortAudio 16 和 17。

图 13-14 展示了在 Audacity 中的录音会话。

在 Audacity 中的样子:两个 Hydrogen 轨道正在录音,两个麦克风轨道

图 13-14. 在 Audacity 中的外观:两个 Hydrogen 轨道录音和两个麦克风轨道

创建持久配置

在 JACK 设置对话框中,你可以创建和保存多个配置文件。创建一个配置;然后在第一个选项卡中在预设名称框中为其输入一个名称,然后点击保存。要打开一个配置文件,点击预设名称框中的下拉箭头。

连接窗口只显示你的当前设置,并不保存它,因此你必须使用 Patchbay 来创建保存的连接。在连接中按照你喜欢的设置连接好一切,打开 Patchbay,然后点击新建按钮。一个小消息会弹出来询问你是否要保存当前的连接配置(图 13-15)。

Patchbay 会询问你是否要保存当前的连接配置

图 13-15. Patchbay 会询问你是否要保存当前的连接配置。

点击,这将自动在连接窗口中复制当前设置。你可以修改它,或者直接接受并使用保存按钮保存,给它一个独特的名称(图 13-16)。

你可以编辑 Patchbay 为你捕获的内容或直接保存。

图 13-16. 你可以编辑 Patchbay 为你捕获的内容,或者直接保存。

JACK 设置

让我们更详细地看看 Qjackctl 设置窗口中的设置。

  • 当你使用实时内核时,应选中“实时”,不使用时则取消选中。

  • 当你有充足的 RAM 时,请保持“无内存锁定”未选中,但如果你使用的是低端计算机,并且遇到内存不足错误,请尝试选中它。这将防止 JACK 锁定内存以供其专用,并释放给所有需要它的进程。

  • 选中“解锁内存”可以帮助低端计算机通过回收被 Qt 和 GTK 等图形工具包吞噬的内存,特别是如果你在 WINE 下运行 VST 插件时。如果没有遇到问题,请保持未选中状态。

  • 选中“软模式”告诉 JACK 忽略 xrun 错误并继续运行。当你希望 JACK 无论发生什么都能继续运行时使用此选项,例如在直播表演期间。最好追踪并修复问题,但并非总是可能,而且 xrun 并不总是意味着你的录音有重大缺陷。

  • 当您的音频接口仅支持 16 位录音时,您可以勾选“强制 16 位”。这不是必需的,因为 JACK 内部使用 32 位,并且它会测试输入和输出设备的 32 位、24 位和 16 位设置。如果您的接口仅支持 16 位或您想以 16 位进行录音,这将减少消息窗口中的常规错误消息。

  • “硬件监控”和“硬件计费”功能可以用于支持这些功能的设备进行硬件监控和计费。例如,MobilePre 有一个零延迟监控端口,因此激活了该功能。硬件计费仅适用于 ALSA 设备,并且很少的录音接口支持此功能。

  • 默认优先级为 10,最大值为 89。通常默认值就足够了。如果您正在运行实时内核,尝试将其设置为 70 或更高,以查看是否有所改变。

  • 每周期帧数控制您在低延迟和较少错误之间的平衡。默认值是每秒从 JACK 发送到您的声卡的 1,024 帧缓冲区,PC 硬件支持的最低值是 64。为了降低延迟,您希望有一个更低的值。如果您在消息窗口中看到很多 xruns,那么将此值增加到更高的数字,直到您没有xruns。xrun 可能是缓冲区溢出或未溢出,xruns 听起来像爆裂声和噼啪声。在我的系统中,JACK 在 128 帧时表现良好,这导致非常低的延迟。一个音频帧是样本数乘以通道数,因此双通道录音每帧有两个样本。一个周期是 CPU 处理周期,因此每周期帧数为 128 意味着每个通道的缓冲区大小为 128 样本,对于两个通道总共是 256 样本。要获取缓冲区大小的字节数,将每周期帧数乘以周期/缓冲区数乘以 4。

  • 样本率设置必须等于您的 Audacity 样本率,并且由您的录音接口支持。较高的样本率会对您的 CPU 造成更大的负担,可能需要在每周期帧数和周期/缓冲区数中设置更高的值。

  • 周期/缓冲区数是内存管理的一个有趣特性。JACK 将内存缓冲区划分为周期,并以周期为单位传输数据。默认值是每个缓冲区两个周期。更多的周期意味着更高的延迟和更大的稳定性。尝试与每周期帧数不同的组合值以降低延迟。例如,如果需要较高的每周期帧数值来降低 xruns,如 2,048,尝试将周期/缓冲区数增加到 3 或 4,并尝试降低每周期帧数。

  • 每个输入或输出连接都是一个端口。默认端口数量为 256 个,对于大多数人来说已经足够,您最多可以有 1,024 个端口。

  • 超时控制 JACK 在拥堵期间等待多长时间来杀死应用程序。默认值为 500 毫秒。

  • 驱动程序设置为你的录音接口使用的任何驱动程序。Freebob 是 FFADO 驱动程序的老版本,用于 FireWire 接口,所以选择“firewire”,因为 Freebob 已经过时(除非你正在运行带有实际旧 Freebob 驱动程序的老系统)。“dummy”是一个用于测试 JACK 的假驱动程序。

  • 当你为输入和输出设备选择(默认),即 ALSA 默认选项时,接口下拉菜单是激活的。然后你有一些额外的选择,如/dev/dsp/dev/oss。这些在现代 Linux 系统中实际上并不相关,但如果你的系统支持它们,JACK 会支持它们。

  • 混响可以使 16 位录音听起来更好;它类似于反锯齿字体或图形图像中的混响。不要为更高的位深度使用混响,因为它是不必要的,而且它们听起来会更差。把它想象成混合粗糙边缘以获得更干净的声音。形状混响被认为是最好的,但它也是最占用 CPU 的。三角形在质量和 CPU 成本之间提供了一个良好的折衷方案,而矩形则轻量级且改动最小。你不必使用混响,但尝试一下也无妨。Audacity 也有混响,所以请确保只使用一个。

  • 在音频菜单中,你可以选择全双工、仅捕获和仅回放。通常全双工工作得很好,但你也可以尝试其他设置,看看是否有性能提升。

  • 从下拉菜单中选择你的输入和输出设备(右侧的小箭头)。

  • 输入延迟和输出延迟用于增加延迟。你可能需要调整这些设置,以便将输入和输出流同步,尤其是在进行多轨录音或应用特殊效果时。

关闭 PulseAudio 和 Phonon

PulseAudio 可能是一个固执的小守护进程。手册页说明你可以使用命令pulseaudio --kill来关闭它。但根据你的特定 Linux 发行版,它不会一直保持关闭状态;相反,它会重新启动。这是在 Ubuntu 10.04 上的工作方式:它有一个正常的初始化脚本在启动时启动它,/etc/rc2.d/S03pulseaudio。但当你尝试以正常方式控制它时,它不起作用,因为运行/etc/init.d/pulseaudio stop不会停止它。删除/etc/rc2.d/S03pulseaudio不会阻止它在启动时启动。幸运的是,我更加固执,已经找到了控制停止和启动 Pulse 的方法。我不想删除它;我想在我需要的时候运行它。(如果你想删除 Pulse,这样做不会伤害任何东西。)

首先寻找一个带有禁用选项的 Pulse 图形控制面板。在我的 Ubuntu 10.04 安装中缺少这个选项,但在 Fedora 和其他发行版中存在。如果你的系统有这个选项,可能这就是你需要的所有东西。

如果没有图形控制面板带有禁用 pulse 的选项,打开 /etc/pulse/client.conf,将 autospawn = yes 改为 autospawn = no,并将 daemon-binary 设置为 /bin/true。确保它们没有被注释,如下所示:

autospawn = no
daemon-binary = /bin/true

接下来,要阻止它在启动时启动,需要几个步骤。首先,删除与你常用运行级别相关的 /etc/rc*.d/S*pulseaudio 链接,或者将其重命名为“kill”链接。这可以防止 init 启动 Pulse。在我的系统中,看起来是这样的:

# mv /etc/rc2.d/S03pulseaudio /etc/rc2.d/K03pulseaudio

你如何知道你的运行级别?使用 runlevel 命令:

$ runlevel
N 2

这意味着运行级别 2,它由 /etc/rc2.d/ 中的链接控制(这些链接必须是 /etc/init.d 中的文件链接,而不是文件本身!)!你的发行版可能有一个很好的图形服务管理器,这是一个很好的选择。

在 Ubuntu 10.04 中,还有一个启动文件需要处理:/etc/X11/Xsession.d/70pulseaudio。这个文件在 Gnome 会话启动时启动 Pulse。将其移动到不同的目录,比如你的家目录。不要删除它,因为将来你可能还会用到它。

其他发行版以不同的方式定制 Pulse,所以如果这些说明不起作用,那么请寻找针对你发行版的特定帮助。这方面的帮助并不少,因为很多用户都在为此而奋斗。另一个小技巧,当你找到启动 PulseAudio 的脚本时,可以将它们调用的二进制文件从 /usr/bin/pulseaudio 改为 /bin/true。这是一个很小的可执行文件,它的唯一任务是“什么都不做,但成功。”这可以让脚本保持满意,并且如果你将来想改回它,它也是一个方便的占位符。

现在你已经清除所有启动脚本,如何停止和启动 PulseAudio?这就像做派一样简单:

$ pulseaudio --kill
$ pulseaudio --start

Phonon 是另一回事。Phonon 只存在于 KDE4 中,并且无法删除,因为几乎所有的 KDE4 都依赖于它。在任何情况下,没有必要停止或删除 Phonon,因为它只占用很少的系统资源,并且不会给你的音频链增加延迟。它有一个令人烦恼的习惯——当像 Pulse 或 JACK 这样的声音守护进程控制一个声卡时,Phonon 会惊慌失措并发出一个关于该声卡缺失的错误消息,并想要将其从菜单中删除。只需点击 取消 来使其安静。

Linux 系统调整

Linux 是一个相当高效的操作系统,所以你不需要采取过激的措施来让它摆脱自己的阻碍。然而,你可以做一些事情来确保最佳的性能。

高性能的 PC 硬件总是好的,而且比高端音频设备便宜。我的音频工作站配备了一个 AMD Phenom X3 2.4 GHz CPU,4GB 的 RAM,以及一个 TB 的 SATA II 硬盘。那些额外的核心带来了很好的效果,因为尽管 Audacity 没有针对多核处理器进行优化,但这些额外的核心意味着更快速、更流畅的多任务处理。我还有一个配备 1.4 GHz CPU、1GB RAM 和较慢硬盘的旧笔记本电脑。它可以熟练地处理多达四通道 16/44.1 的录音,但在更高的比特深度或采样率下,它往往会停滞。我认为 1 GHz CPU 和 512MB RAM 是音乐录制和编辑的最低要求。对于播客和有声读物录制,你可以低至 128MB RAM 和 500 MHz CPU。

关闭你的屏幕保护程序和所有花哨的视频效果。所有那些 CompizFusion 的闪亮效果虽然很漂亮,但会妨碍良好的音频。实际上,你应该关闭所有绝对不需要的东西:不要运行其他应用程序,关闭不必要的服务。通常不会有太多冗余;蓝牙、无无线设备的系统上的无线守护进程,以及 Wacom 平板电脑守护进程是最常见的默认开启服务,大多数用户并不需要。

KDE 和 GNOME 都是耗资巨大的桌面系统,它们对 CPU 和内存的需求很大,因此你可以通过使用更轻量级的图形环境,如 Xfce、IceWM、LXDE、Fluxbox 或众多其他轻量级 Linux 图形环境来精简你的系统。

视频是 PC 上对系统要求最高的单一组件,因此你可能想要升级到更好的显卡。许多低端系统使用共享的系统内存而不是专门的图形处理单元(GPU)。换句话说,它们使用你的一些系统 RAM 来处理视频,这相当慢,因为它会给你的系统 RAM 和 CPU 增加额外的负载,而这两者的速度都远远慢于 GPU。GPU 的速度如此之快,以至于它们被用来构建用于非常快速、非常强大的高端科学计算的集群。

根据你的发行版,你应该有一个好的图形系统资源监控器,这样你可以看到你的系统资源在哪里被使用。古老的top命令仍然是查看活动进程及其使用多少系统资源的有用工具。启动top后,按 1 键可以看到多核 CPU 中的所有核心:

$ top

Tasks: 232 total,   1 running, 231 sleeping,   0 stopped,   0 zombie
Cpu0  :  3.7%us,  0.7%sy,  0.0%ni, 95.7%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu1  :  7.6%us,  0.7%sy,  0.0%ni, 90.1%id,  1.7%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu2  :  0.0%us,  0.7%sy,  0.0%ni, 99.3%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st

Mem:   4056672k total,  1602700k used,  2453972k free,   171880k buffers
Swap:  7092636k total,        0k used,  7092636k free,   655412k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
17132 alrac     20   0  663m  35m  22m S    8  0.9   0:27.99 audacity
 2208 root      20   0  181m  83m  14m S    3  2.1  32:02.89 Xorg
10683 alrac     20   0  620m 147m  28m S    1  3.7   4:37.10 firefox
 2763 alrac     20   0  212m  10m 8276 S    1  0.3   3:00.33 multiload-apple

这表明一切正常。顶部的摘要告诉我们许多信息:有一个进程正在运行,其余的,也就是全部 231 个,都在休眠状态。三个 CPU 核心正在忙碌地工作。

所有这些字段都在man top这个友好的手册页中进行了解释。你的top版本可能显示不同的字段,但它仍然是同一个top命令。顶部部分是摘要,底部部分是任务区域。

在总结中,CPU 状态(详细查看)很有趣,但要注意的主要字段是us,即用户字段,它显示每个 CPU 的负载,以及sy,即系统字段,它显示来自内核进程的负载。如果你看到sy值持续大于 10%,你应该追踪原因,因为通常它应该是单个数字。

MemSwap字段告诉你你的物理 RAM 是否足够。只要Swap的使用率为零,并且你的Mem没有达到最大值,这对音频处理来说就是理想的,因为 RAM 比硬盘上的交换文件快得多。

在任务区域下方,你可以看到关于你系统上每个进程的信息。再次强调,不要对细节过于着迷,但看看顶部最大的使用者。这很快就能揭示谁是 CPU 和内存的消耗者。在这个网站沉重、脚本和 Flash 繁多的时代,网络浏览器可能非常消耗资源,所以关闭它们。音频处理消耗了很多 CPU 周期,所以这是你要关注的主要事情。如果你持续达到 75%以上,考虑升级你的 CPU。Linux 内核和大多数 CPU 不介意工作得那么努力,但在那个水平上,你可能注意到性能变慢。

你可以稍微调整交换文件的大小以获得更好的性能。如果你有 512MB 或更少的 RAM,将你的交换文件大小至少设置为与你的 RAM 大小相等。如果你有 1GB 或更多的 RAM,将你的交换文件大小不超过你 RAM 的一半。但不要完全删除你的交换文件——笔记本电脑需要它们来挂起和休眠,而且如果你用完了所有的物理内存,那个交换文件可能会救你的录音会话。

如果你使用的是 PCI 声卡,请查阅你的主板手册以找到一个不使用共享中断的插槽。PCI-Express 声卡很棒,因为 PCI-E 使用专用总线,而不是像旧 PCI 2.0 标准那样的共享总线。目前还没有很多 PCI-E 声卡;以 RME HDSPe MADI 系列为例,它是第一流的,并且在 Linux 上运行。

不要使用网络文件共享,除非是存储你的音频文件的备份,因为它们太慢了。

Linux 音频的错综复杂的历史

原始的 Linux 音频子系统是 Sound Blaster 16,这“只是发生了”因为 SB16 声卡有最好的支持和良好的 API。那些足够老以至于还记得 i386 PC 的人可能也会记得,竞争品牌使用 SB16 模拟,因为这是阻力最小的路径。这演变成了开放声音系统(OSS),它可以在所有 Unix 和 Unix 类型的操作系统上运行。它仍然存在并且得到维护,并且它经常与 ALSA 中的 OSS 兼容模块混淆。

随着声卡变得更便宜,并且更多地依赖软件来处理混音而不是在硬件中混音,OSS 失去了受欢迎的地位。因此,ESD(Gnome)和 aRts(KDE)应运而生;这些在将音频流发送到 OSS 之前负责混音。然而,这使事情变得复杂,因为 Linux 开发者现在必须处理三个不同的声音系统。Simple DirectMedia Layer(SDL)随后被发明为一个可使用任何音频后端的可移植层,但它有一些限制,阻止它成为伟大的 Linux 音频统一者。就像生活中的其他事物一样,它并没有消失,但仍然在一些应用程序中使用。你可能在你的系统上也有它。

然后 OSS 变成了闭源软件,用户必须为此付费。这对坚韧的 Linux 开发者来说是最后一根稻草,他们通过发明 ALSA 来反击。所以,ALSA 就这样成为了标准的 Linux 音频子系统。一个好的引发争论的方法是点燃 OSS 与 ALSA 的辩论——很多人对这个话题仍然有强烈的激情。

OSS 4.x 在 2007 年以 GPL 许可发布 Linux 版本时再次成为自由软件,现在有两个版本:GPL 版本和包含一些非自由驱动器的商业版本。一些用户声称他们的音乐听起来更好,而且 OSS 更简单、更好用。我认为这很多都是一厢情愿的想法,但如果你喜欢 OSS,我不会因此而小看你。

我更喜欢朴素的 ALSA。它在几乎所有 Linux 系统中都是默认的,而且它工作得很好。就像 Linux 一样,在购买之前先做做功课,确保你购买的是得到良好支持的硬件。ALSA 项目有一个支持的声音卡矩阵,可以在 www.alsa-project.org/main/index.php/Matrix:Main 找到。

ESD 是旧的 Gnome 和 Enlightenment 声音服务器,它运行在 ALSA 之上。它可以管理多个声音流和网络播放。PulseAudio 已经取代了 ESD 在 GNOME 中的位置。

aRts 也管理多个流和网络播放。不要使用 aRts,因为它会增加超过可接受水平的延迟,并且它注定要失败——它已经有一段时间没有维护,并且过时了。Phonon 在 KDE4 中取代了 aRts。Phonon 不是一个声音服务器或 API,而是旨在成为所有音频和视频播放服务器和子系统的通用接口。Phonon 不会妨碍,所以你可以让它保持原样。

Linux 桌面播放音频的未来是模糊的。PulseAudio 准备成为桌面 Linux 的标准声音管理器,但有人说还有一些更深层的问题需要解决,而 PulseAudio 无法解决。所以,不要对任何事感到惊讶。

声音卡

请访问附录 A 了解在 Linux 上得到良好支持的声卡,从低预算到高端。记住,仔细购物并购买在 Linux 上得到良好支持的硬件非常重要。Linux 上有许多高质量的音频硬件可以工作——生命太短暂了,不应该浪费在低质量或支持不佳的音频设备上。

第十四章。配置 Windows 以获得最佳音频质量

无标题图片

目前,Microsoft Windows 用户处于一个有趣的位置。尽管 Windows XP 作为 2001 年首次发布时的 Methuselah 在计算机年份中已经相当古老,但它仍然是最受欢迎的 Windows 版本。微软已经尝试多次将其退役,但它不会消失。2010 年 7 月,微软宣布将 XP SP3 的支持延长至 2014 年 4 月。在 Windows 7 的原设备制造商(OEM)生命周期结束之前,XP 将继续作为 Windows 7 购买者的降级选项,而 Windows 7 的原设备制造商生命周期在下一个 Windows 版本发布两年后结束。因此,XP 还将与我们相伴很长时间。

在您的音频制作电脑上坚持使用 XP 有充分的理由。它对系统要求节俭,操作系统和服务包只需不到 5GB,并且使用 1 GHz CPU 和 512MB RAM 也能正常运行。将其安装在拥有 1GB RAM 的双核笔记本电脑上,您就拥有了一个功能强大的便携式录音室。

Windows Vista 在市场上并没有获得太多关注。在撰写本文时,音频硬件制造商终于开始赶上并为其产品发布 Vista 驱动程序。Audacity 1.3.x在 Vista 上运行良好。但 Vista 是一个系统资源消耗者,仅自身就需要 12+GB 的硬盘空间。官方要求 Vista Home Basic 至少需要 1 GHz CPU 和 512GB RAM,其他版本至少需要 1GB RAM,但如果您只有这些,那么使用起来就像在深沙中跋涉。仅用于基本任务(如电子邮件和网络浏览)就需要 2 GHz CPU 和 2GB RAM。我建议至少使用 2 GHz 双核 CPU 和 4GB RAM 来在 Vista 上运行 Audacity。

Windows 7 的系统要求也适用于 Vista。它与 Vista 没有太大区别;它更加精致,内存管理略好,用户账户控制不那么烦人,启动速度也略快。声音控制面板有一个很棒的功能,即一个通信选项卡,其中包含为您的播放设备设置简单自动降音的设置。您可以为诸如在接收到 Skype 电话时自动静音所有其他声音等任务进行配置。

启用 MP3 支持

由于 MP3 音频格式(更准确地说,MPEG-1 音频层 3)存在专利限制,Audacity 中没有包含 MP3 编码器。然而,您可以轻松地获取 LAME MP3 编码器,这是一个高质量、跨平台的免费软件 MP3 编码器和解码器。获取它的方法之一是遵循 Audacity 下载页面上的说明。另一种方法是在 Audacity 内部,通过将文件导出为 MP3。如果您的系统上没有 LAME,您将看到一个类似于图 14-1 的对话框。

点击下载按钮直接进入 LAME 下载页面。您可以下载一个压缩包或未压缩的存档。安装程序是一个标准的 Windows .exe 文件;只需下载它,双击下载的文件,然后按照安装步骤进行。它将 LAME 放入\Program Files\Lame For Audacity。您可以通过查看编辑 > 首选项 > 对话框来验证它是否安装成功。点击 MP3 库:定位,它将显示完整的文件路径(图 14-2)。

在 Audacity 内部安装 LAME,请点击 MP3 导出对话框中的下载按钮。

图 14-1. 在 Audacity 内部安装 LAME,请点击 MP3 导出对话框中的下载按钮。

安装 LAME 后,库对话框显示完整的文件路径。

图 14-2. 安装 LAME 后,库对话框显示完整的文件路径。

启用 WMA、M4A/M4P 支持

Audacity 原生支持开放、不受限制的音频编解码器和格式,如 WAV、AIFF、Ogg Theora 和 FLAC。但就像 MP3 一样,Audacity 不能附带对封闭、专有或受专利限制的格式的支持,如 Windows Media Audio (WMA)、M4A(有损压缩格式)或 M4P(添加了 DRM 的 M4A)。M4A 和 M4P 是苹果 iTunes 商店的默认格式。它们使用高级音频编解码器(AAC)。分发使用 AAC 编解码器的任何形式的录音不需要许可证或付款,但任何制造 AAC 编解码器的人都需要购买专利许可。开源编解码器通过发布源代码而不是现成的二进制应用程序,并在友好的国家托管他们的下载服务器来规避这一点。许多国家不执行美国的软件专利法,甚至不承认软件专利的有效性,并明确允许反向工程。因此,当涉及到弄清楚所有这些时,魔球占卜有最终的答案:“回答模糊,再试一次。”

简而言之,您可以通过安装 FFmpeg 来添加对大量非自由和受限制的音频(和视频)文件格式的支持。Audacity 内置了 FFmpeg 支持,您以与 LAME 相同的方式安装它。就像 LAME 一样,它将被放置在\Program Files\FFmpeg for Audacity中。

LAME 和 FFmpeg 都可以安装,您可以通过编辑 > 首选项 > 来验证它们在系统中的位置(图 14-3)。

FFmpeg 和 LAME 也可以从编辑 > 首选项 > 库中安装。

图 14-3. FFmpeg 和 LAME 也可以从编辑 > 首选项 > 库中安装。

低延迟录音和音频驱动程序乐趣

在计算机上录制意味着您必须关注驱动程序。很多。

标准的 Windows 多媒体扩展 (MME) 音频系统支持双通道 16 位 44.1Hz 录音。这是一个从 Windows 3.1 时代就存在的旧系统。然后微软为 Windows 2000 及更高版本开发了 Windows 驱动模型内核流 (WDM/KS) 和增强型 Windows 驱动模型 (EWDM) 驱动程序。Audacity 支持所有这些。如果您想同时录制超过两个通道,您需要具有完整 EWDM 支持的声卡。大多数音频设备声称支持 WDM,但这并不总是意味着 EWDM 或 WDM/KS,因此它们可能不支持同时从超过两个输入进行录音。

Audio Streaming Input/Output (ASIO) 驱动程序是 Windows 的高质量、低延迟音频接口。不幸的是,Audacity 无法提供对它的支持,因为它是一个封闭的、专有的驱动程序。因此,您有两个选择:坚持使用支持 EWDM 或 WDM/KS 的设备,或者自己编译带有 ASIO 支持的 Audacity。为此,您需要 Steinberg 公司提供的 ASIO 软件开发工具包 (SDK),该公司拥有 ASIO 驱动程序,以及从 SourceForge 上的 CVS 仓库获取的最新 Audacity 源代码。您还需要 Microsoft Visual C++ 8,它是 Visual Studio 的一部分,以便在 Windows 上编译 Audacity。

在您能够下载 ASIO SDK 之前,您需要在 Steinberg.net 上注册一个开发者账户。这是免费的,而且很简单。按照 Audacity 下载页面上的说明获取最新的 Audacity 源代码。然后在 Audacity 源代码树中找到 win\compile.txt 文件,因为它提供了使用 ASIO 支持构建 Audacity 的详细说明。

注意

您必须注意一些许可问题。您可以为个人使用仅构建带有 ASIO 支持的 Audacity 复制品:您不能分发它们。这将违反 Audacity 的许可(GPL)和 Steinberg 的 ASIO 许可。Audacity 维护者鼓励用户给 Steinberg 发送电子邮件,礼貌地请求它开源 ASIO 驱动程序。

最简单的方法是请一个已经拥有 Microsoft Visual Studio 的朋友帮忙。编译 Audacity 以包括 ASIO 支持可能听起来很麻烦,但对于已经熟悉 Visual Studio 的人来说,这相当简单。您需要在 Audacity 中使用 ASIO 支持吗?不需要,如果您仔细挑选,您可以找到具有高质量 EWDM 或 WDM/KS 驱动程序的录音接口。仅仅拥有 ASIO 驱动程序并不能保证设备性能良好,因为存在糟糕的 ASIO 驱动程序。也有糟糕的 EWDM 和 WDM/KS 驱动程序,所以在购买任何东西之前做好功课。

如果你能在 Audacity 中启用 ASIO 支持,你将拥有更多硬件和配置选项。许多高端声卡支持多个驱动程序,包括 ASIO 和 WDM 系列,因此你可以尝试不同的驱动程序,看看哪个表现最好。

调整 Windows 以获得最佳性能

良好的音频录制需要一个干净、性能良好的计算机,不要被不必要的应用程序和服务拖累。Windows 系统因加载无用垃圾而闻名,所以我们将回顾如何给它进行一次彻底的清理。

性能缓慢的常见原因是使用共享系统内存的视频控制器。这些控制器会消耗 CPU 周期和 RAM。如果你有这类控制器,购买一个独立的图形控制器将物有所值;性能差异将很大且明显,因为处理负载将由显卡承担。如果你有廉价的共享内存视频,你应该能够升级,无论是笔记本电脑还是台式机 PC。你的笔记本电脑将有非常具体的要求,你应该能够从手册或制造商的网站上找到这些信息。台式机 PC 应该提供更多的灵活性。

你必须将你的显卡与主板相匹配,因为台式机 PC 显卡有几种不同的 PCI 插槽类型:PCI、AGP 和 PCI-e。你必须匹配插槽和正确的电压。同时确保有足够的空间安装你的新显卡,因为其中一些是带有巨型散热风扇的怪物。这些巨型野兽是为游戏玩家准备的,而不是音频制作设备。便宜且小巧的显卡也能满足需求。如果你已经在使用集成显卡,你可能需要进入系统 BIOS 来禁用它。如果你觉得这些听起来像外语,你可能需要找一个知识渊博的朋友帮忙,甚至支付专业人士的费用。

总是安装最新的 Windows 更新,特别是服务包。确保你有音频设备的最新驱动程序。定期运行磁盘碎片整理和磁盘清理。

关闭所有非录音必需的设备:其他应用程序、屏保、防病毒软件、系统维护应用程序、防火墙、网络浏览器、电子邮件、“娱乐”垃圾软件、广告软件、花哨的特殊效果——所有这些。病毒检查器和 Windows 防火墙是臭名昭著的系统资源消耗者,但显然禁用它们会使你的系统失去保护,所以你将想要断开任何网络连接。不要忘记关闭 Wi-Fi 和蓝牙。一些笔记本电脑有漂亮的物理开关来关闭这些功能;否则,进入网络连接控制面板来禁用它们。如果你需要保持连接,你将不得不保持保护功能开启。

提高 Audacity 在任务管理器中的优先级

图 14-4. 在任务管理器中提高 Audacity 的优先级

在任务管理器中提高 Audacity 的优先级。要打开任务管理器,请按 ctrl-alt-delete。请只按此组合键一次,否则 Windows 将重新启动。转到任务管理器中的“进程”标签页,右键单击 Audacity 的条目(图 14-4). 默认优先级是正常,你应该能够将其提高到高优先级,而不会使其他进程不高兴。将其提高到实时优先级似乎是一个明显的选择,但它会使我的系统不稳定。你可能会有更好的结果。

你可以安全地禁用许多 Windows 服务,这些服务消耗内存和 CPU 周期,对你几乎没有好处,其中一些甚至还是安全风险。第三方软件供应商喜欢用各种垃圾塞满 Windows。你可以在任务管理器的“进程”标签页中查看哪些进程消耗了最多的 CPU 和内存,然后快速的网络搜索应该会告诉你这个服务是做什么的,以及你是否需要保留或驱逐它。我们将在下一两个部分中详细讨论一些常见的违规行为。

调整 Windows XP

通过关闭不必要的和危险的服务来微调 Windows XP

图 14-5. 通过关闭不必要的和危险的服务来微调 Windows XP

首先,我们将从一些简单的事情开始:在 Windows XP 中,右键单击我的电脑并选择属性。点击“高级”标签页,然后点击“性能设置”按钮(图 14-5). 在“视觉效果”标签页上,选择“调整以获得最佳性能”。这会关闭基本的 Windows XP 视觉效果。

当你仍在性能选项中时,转到“高级”标签页。默认情况下,Windows 的分页文件是动态的,根据需求改变其大小。在虚拟内存菜单中将其更改为固定大小;这会给你带来一点更快的性能。如果你有 512MB 或更少的 RAM,将你的交换文件大小设置为你的 RAM 的 1.5 倍。对于 1GB 到 4GB,使其为你的 RAM 的一半。对于超过 4GB 的,尝试一个最小大小,如 512MB。你希望 Audacity 使用你快速的 RAM,而不是慢的分页文件。

注意

分页文件是虚拟内存。如果 Windows 用完 RAM,它将使用硬盘上的分页文件。读取和写入硬盘比使用 RAM 慢得多,因此总是有更多的 RAM 比有更大的分页文件要好。

现在,离开性能选项并转到系统还原选项卡。我建议通过勾选“关闭所有驱动器的系统还原”复选框来禁用系统还原,尽管如果你想保留它也可以。根据我的经验,它占用了磁盘空间并稍微减慢了系统速度,但并不特别有用,因为似乎失败和问题都会被系统还原忠实地保存。你最好的保护措施,一如既往,是定期在外部媒体上备份数据。

接下来,转到“自动更新”选项卡并关闭它们。这意味着你必须记得手动运行更新——不要忘记!你不想在录音或编辑会话期间启动更新器,因为它会拖慢你的系统,弹出不必要的消息,然后催促你重启。

在“远程”选项卡上,禁用“允许从这台计算机发送远程协助邀请”和“允许用户远程连接到这台计算机”。嘿,这是巨大的安全漏洞,而且它们还占用了一些系统资源。当你知道你需要它们时,你可以随时打开它们;其余时间它们应该被禁用。

我们已经完成了系统属性,准备继续前进。现在你想查看在启动时设置的服务,并将那些不需要一直运行的服务设置为手动或禁用。在 控制面板 > 管理工具 > 服务 对话框中执行此操作。许多第三方软件会以各种不必要的附加组件使你的系统变慢。一个例子是我 M-Audio MobilePre 一起提供的 USB 音频接口软件 CD。Windows XP 已经内置了一个非常好的 USB 音频接口,因此你不需要安装任何额外的东西——MobilePre 不需要额外的麻烦就能正常工作,这些麻烦包括驱动程序安装程序和一个基本的音量控制面板。没有什么值得兴奋的,也没有什么特别有用的。许多 USB 音频设备都这样做,所以先尝试不安装任何额外软件。

这里是一个简短的清单,列出了应该禁用的服务,因为它们是不必要的或存在安全风险,或者两者兼而有之。虽然你欢迎这样做,但并不需要追踪并删除每个非绝对必要的服务。TweakHound (www.tweakhound.com/) 是一个详尽且可靠的 Windows 系统调整指南,包括好的调整和不好的调整。同时,对特定服务进行网络搜索也是有帮助的。在不知道它做什么的情况下不要更改任何内容;你不想删除必要的 Windows 服务。当你将运行中的服务更改为手动或禁用时,你还需要停止它。双击服务以打开配置对话框。

这些是一些更常见的违规行为:

Alerter

发送管理警报。这是无用的,并且默认情况下应该在服务包 2 和 3 中禁用。

ClipBook

另一个“谁会认为这是个好主意”类别的赢家——剪贴簿与远程用户共享你的剪贴板内容。在 XP Service Packs 2 和 3 中,它应该默认禁用。

网络 DDE,网络 DDE DSDM

这管理着动态数据交换(DDE)网络共享,这些是像剪贴簿这样的讨厌东西。在 XP Service Packs 2 和 3 中,它应该默认禁用。

路由和远程访问

将你的计算机变成一个路由器并共享互联网连接。不,在你录制和编辑的时候不要这么做。在 Service Packs 2 和 3 中,它应该默认禁用。

错误报告服务

向微软报告各种未知信息。将其禁用。

索引服务

虽然在系统上建立文件数据库以加快搜索听起来在理论上是好的,但索引器是一个主要的资源消耗者,我保证它会在你不想它运行的时候运行。我已经尝试过在有和没有索引服务的情况下进行搜索,两种方式都没有太大的区别。将其禁用。

信使

与警报服务和一个著名的漏洞相关。始终禁用它。

红外监控器

有没有人使用红外设备?如果你有一个红外无线键盘、鼠标或任何通过红外连接的设备,请保持开启。否则,将其禁用。

智能卡

有人在 Windows PC 上使用任何类型的智能卡吗?如果他们用了,我就吃我的帽子。将其关闭。

Telnet

为什么这个还在?Telnet 完全不安全——你永远永远不想在你的 PC 上启用 telnet 访问,除非在完全安全和可控的条件下,你知道你真的、真的想这么做,而且你可以在完成后将其关闭。将其禁用。

主题

“提供用户体验主题管理。”随便吧。这会消耗多达 15MB 的 RAM。将其禁用。

终端服务

这允许远程桌面共享和管理。将其禁用,然后只在你想使用它的时候打开。

WebClient

“Web 客户端服务允许 . . . 标准 Win32 应用程序通过使用 WebDAV 协议在 Internet 文件服务器上创建、读取和写入文件。”禁用它;这是一个臭名昭著的安全漏洞,没有任何有用的功能。

图 14-6 显示了服务控制面板的外观。

在 XP 服务控制面板中管理服务

图 14-6. 在 XP 服务控制面板中管理服务

你可能已经安装并启用了 FTP 和万维网发布者服务;在录制和编辑会话期间禁用它们。如果你没有将你的系统用作 FTP 或 Web 服务器,请永久禁用它们。

根据你的系统安装情况,你会发现各种第三方服务正在运行并拖慢你的 Windows PC:Norton、McAfee、TrendMicro、QuickTime、Adobe、Java、Macromedia、奇怪的屏幕保护程序,新闻源,每日可爱的狗狗图片,虚假的系统优化和注册表清理程序等等;背后发生的事情真是令人惊讶。理想情况下,你的电脑将是一个精简、高效、专注于音频制作的机器,尽可能减少冗余。

调整 Windows Vista 和 7

关闭资源密集型特殊效果

图 14-7. 关闭资源密集型特殊效果

Vista 和 7 对布局做了一些调整。要控制显示和特殊效果设置,首先打开控制面板并将其设置为经典视图。然后打开系统 > 高级系统设置。这会打开系统属性对话框,其中包含几个标签页。点击高级标签页,点击性能设置按钮,通过勾选“调整以获得最佳性能”来关闭所有华丽效果。这会关闭所有特殊效果(图 14-7)。

在高级标签页调整页面文件大小,它位于视觉效果标签页旁边。默认情况下,Windows 页面文件是动态的,根据需求改变其大小。将其更改为固定大小以获得更快的性能;在虚拟内存下点击更改按钮。如果你有 1GB RAM 或更少,将交换文件大小设置为 RAM 的 1.5 倍。对于 1GB 到 4GB,设置为 RAM 的一半。对于超过 4GB,尝试一个最小大小,如 512MB。你希望 Audacity 使用你快速的 RAM,而不是缓慢的页面文件。

关闭性能选项并切换到系统保护标签页。我建议在这里关闭系统还原,尽管如果你希望保留它,我也不会抱怨。要禁用它,请取消选中自动还原点框中的所有复选框。根据我的经验,它消耗了大量的磁盘空间,但提供的益处并不多。我更愿意依赖良好的定期数据备份,而不是希望 Windows 在有问题时能自我修复。

现在切换到远程标签页,取消选中“允许远程协助连接到此计算机”。这是一个潜在的安全漏洞,你应该只在知道将要使用它时才开启它。这里的工作已经完成,所以点击确定关闭系统属性。

Windows Update、Windows 防火墙和 Windows Defender 都在 控制面板 > 安全中心 中配置。为了从 Windows Vista/7 中获得最佳性能,请关闭所有服务。当然,当你这样做的时候,你的系统会变得脆弱,所以在进行音频工作时不要连接到任何网络。自动更新特别麻烦,因为它会在运行时中断你正在做的事情,用提示信息打扰你,然后在大多数情况下要求重启。然后重启可能需要很长时间,因为它需要应用和配置更新。你可以选择在方便的时候手动运行更新程序。

与之前的 Windows 版本相比,Vista 和 7 在不运行大量无用且危险的服务方面做得更好。但你应该仍然逐一检查并进行一些清理。不要在不了解其功能的情况下更改任何设置;你不想破坏关键的 Windows 服务。对特定服务的快速网络搜索应该能告诉你关于它们所需了解的信息,尤其是如果它们是 Windows 服务的话。TweakHound (www.tweakhound.com/) 是一个详尽且可靠的 Windows 系统调优指南。

服务在 控制面板 > 程序和功能 > 启用或关闭 Windows 功能 对话框中控制。你的系统可能包含或不包含以下服务,这取决于你运行的 Windows 版本以及安装了哪些额外组件。

索引服务

为所谓的更快搜索索引你的文件。它会在你不想的时候运行,并干扰一个很好的录音会话。请关闭它。你不会在 Windows 7 中看到它,因为它被 Windows Search 取代。这些服务默认应该关闭。

Internet Information Services

你正在运行 SMTP 或 FTP 服务器吗?没有?那么请关闭它。默认情况下应该已经关闭。

Microsoft.NET 框架

微软不断地将 .NET 组件塞入每个可用的 Windows 电脑中,无论这样做是否有意义。你可能有一些依赖于它的应用程序,所以请让它保持原样。

平板电脑可选组件

你在使用平板电脑吗?没有?那么请关闭它。

Telnet 客户端/Telnet 服务器

总是关闭这些服务,除非你真的想使用它们。Telnet 完全不安全,不应该默认开启。

Windows 会议空间

这被宣传为一种协作工具,是 NetMeeting 的更新版。它并没有比 NetMeeting 工作得更好。除非你想使用它,否则不要开启它。

配置 Windows 音频设备

Windows XP 中的录音设备选择器——不要选择微软声音映射器

图 14-8. Windows XP 中的录音设备选择器——不要选择微软声音映射器

我们已经讨论过的古老的 Windows MME 声音系统,在 Audacity 中显示为 MME:Microsoft Sound Mapper(见图 14-8)。如果你选择它作为你的录音设备,你将得到在声音控制面板中设置的默认录音设备。不要选择这个作为你的录音设备——选择你设备的精确驱动程序。我系统的正确选择是 MobilePre 和板载 SoundMAX 音频芯片组。

控制面板 > 声音控制面板包括用于调整录音和播放音量的混音面板。你可以在 Audacity 中录音或播放时使用它来调整录音电平。在“播放”选项卡上,选择你的播放设备,点击配置以获取一个简单的扬声器测试器。这是一个快速简单的方法来验证你的扬声器是否正确连接并且正常工作(图 14-9)。

注意“录音”选项卡上的简单小 VU 表,显示录音电平(图 14-10)。

在播放 > 配置对话框中测试你的扬声器。如果这是一个时尚的 5.1 环绕系统,你将能够测试每个通道是否正确路由到正确的扬声器,以及所有扬声器是否正常工作。

图 14-9. 在播放 > 配置对话框中测试你的扬声器。如果这是一个时尚的 5.1 环绕系统,你将能够测试每个通道是否正确路由到正确的扬声器,以及所有扬声器是否正常工作。

使用 Windows 控制面板调整录音音量

图 14-10. 使用 Windows 控制面板调整录音音量

图 14-11 显示了 Vista 中我的 M-Audio MobilePre 的属性对话框。Vista 将其称为“模拟连接器”;幸运的是,如果你想要给它一个更具体的信息性名称,可以更改它。使用这个选项来启用声音设备,控制录音电平和平衡,并设置录音质量级别。确保 Windows 中的质量级别与 Audacity 的设置一致。我对为什么平衡设置需要额外点击并需要自己的特殊对话框感到困惑,因为当在“电平”选项卡上有大片空白空间时。但我知道什么呢;我并不是一个精英软件设计工程师。

Windows 提供了一些简单的播放和录音控制。

图 14-11. Windows 提供了一些简单的播放和录音控制。

请访问附录 A 获取有关声卡和其他音频硬件的信息。

第十五章。自定义 Audacity

无标题图片

Audacity 在编辑 > 首选项对话框中提供了一些可配置的选项。您可以通过设置 Audacity 的默认选项以适应自己的工作流程来提高效率,因此在本章中,我们将学习所有关于它们的内容。

Audacity 在 1.3 系列中经历了重大变化,这是最终 2.x版本的 beta 版。Audacity 的开发者热情高涨,进行了大量优秀的改进和新增。您在本章中看到的内容应该非常接近最终发布版本,但如果有一些差异,请不要感到惊讶。

自定义 Audacity 的默认选项

Audacity 的默认选项在编辑 > 首选项中设置,您也可以通过按 ctrl-P打开。许多这些设置可以在菜单和工具栏中覆盖,这比每次想要临时更改设置时打开首选项对话框要快。图 15-1 显示了 Windows 中主要首选项菜单的外观。

记得在启动 Audacity 之前将任何 USB 或 FireWire 设备插入并打开,否则 Audacity 将无法检测到它们。

让我们从顶部开始,逐步向下进行。

设备

在设备对话框中,主机是您操作系统的基本声音系统。对于 Windows,这应该是 DirectSound 而不是 MME。播放和录音设备应该是您的特定设备。在图 15-1 中,我选择了我的 ThinkPad 上的 SoundMAX 集成芯片组。您的声卡可能不同。您还可以选择主声音驱动程序,这意味着默认录音和播放设备在 Windows 控制面板的声音模块中已选择。

在 Windows 中选择默认录音和播放设备

图 15-1. 在 Windows 中选择默认录音和播放设备

对于 Linux 用户,主机将是 ALSA、JACK 音频连接套件或开放声音系统(OSS)。播放和录音设备选择器可以使用 ALSA 默认设置或选择特定设备(图 15-2

图 15-2. 对于 Linux 用户来说,看起来是这样的:在我的系统中,默认的录音设备选择器显示内置的 ATI 芯片组、MobilePre USB 和 ALSA 默认设置。

录音通道的数量取决于你的录音接口支持什么。例如,如果你有一个具有 10 个通道的多通道接口,你可以选择 10 个,即使你没有使用那么多。然后 Audacity 将打开 10 个音轨,所以如果你在其中的 6 个上录音,你将有 4 个空音轨。

播放

播放对话框(图 15-3

图 15-3. 播放对话框

Audacity 的许多特殊效果(在生成和效果菜单中)都有预览按钮,这样你可以在实际将它们应用到音轨之前听到你的更改。预览长度控制着预览的持续时间。

剪辑预览是一个用于预览当你剪辑音轨的一部分时音轨将如何听起来很酷的工具。默认为 1 秒,但你可以设置为任何你喜欢的。选择你认为想要剪辑的音轨部分,但不要剪辑它;只需选择它。然后按键盘上的 C 键,你将听到选择前后的音频预览,就像你已经进行了剪辑一样。要播放选择,请按空格键。

记得如何更改选定区域的大小吗?确保你有选择工具处于活动状态。将光标移至选定区域的边缘;它应该变成一个小 I 形光标。按住 shift 键,然后点击并拖动。shift-right arrow 或 shift-left arrow 扩展选择,而 shift-ctrl-right arrow 或 shift-ctrl-left arrow 缩小它。

播放时的搜索时间控制着 Audacity 的跳转前进功能的长度。当你播放音轨时,按左箭头键或右箭头键可以向前或向后跳转 Short period 设置中的秒数。按住 shift 键,然后按左箭头键或右箭头键可以跳转到 Long period 设置中的长度。

录音

录音对话框(图 15-4

图 15-4. 录音窗口

选中“叠加:在录制新音轨的同时播放其他音轨”以在听现有音轨或音轨的同时录制新音轨。例如,你可以首先录制一段优美的提琴音轨。然后启用叠加,提琴音轨将在你录制人声音轨、第二提琴或其他任何你想要的音轨时播放。

“软件播放:在录音或监控新轨道时收听”通过您的播放设备监控您的录音会话。软件播放仅在录音输入和播放位于同一声卡上时才工作。(Linux 用户:如果它们是不同的设备,您可以使用 JACK 创建连接。)这不是监控录音会话的最佳方式,因为可能会出现明显的延迟,并且可能会增加足够的 CPU 负载导致跳音。您的录音接口上的专用监控端口更好。如果您没有,可以尝试使用软件播放。(注意,它说“在录音立体声混音时取消选中”。换句话说,它仅与单声道轨道一起工作。)您还可以从传输菜单中启用和禁用叠加和软件播放。

你可能会在延迟部分花费一些时间,试图在性能和减少延迟之间找到最佳平衡。音频缓冲控制内存中缓冲的音频量。当这个缓冲区更大时,性能更平滑,但延迟增加。当它较小时,延迟减少,但如果音频缓冲区太小,CPU 将无法跟上,会出现跳音和卡顿。当你进行叠加录音或使用软件播放时,较高的延迟是明显的。(有关更多信息,请参阅叠加录音。)

延迟校正补偿了叠加录音中不可避免的延迟。播放时始终存在一些延迟,因此当你进行叠加录音时,新轨道总是落后于播放轨道。(有关更多信息,请参阅叠加录音。)

可以在这里启用声音激活录音,并设置触发录音的分贝水平。您也可以从传输菜单中完成此操作。

质量

质量对话框(图 15-5)设置了播放和录音的默认音频质量值。

质量对话框

图 15-5. 质量对话框

样本部分设置了默认的采样率和比特深度,在这个菜单中分别称为采样率和采样格式。这些设置可以在单个轨道菜单和选择工具栏中覆盖。请注意这里的术语混淆——采样格式比特深度是同一件事,但比特深度是正确的术语。只有在 Audacity 中比特深度才被称为采样格式。

实时转换设置选择应用于 Audacity 中播放音频文件的采样率和比特深度转换类型。当你的音频文件采样率与项目速率不同时,会发生重采样。如果音频文件的比特深度与项目比特深度不同,它将被转换为项目值。这不会改变文件,因为转换是在播放时即时进行的。最佳 Sinc 插值器执行最高质量的转换。但它很耗 CPU,所以如果播放变慢,尝试中等 Sinc 插值器。快速插值器、零阶保持(ZOH)插值器和线性插值非常快,但不是很好,并且会引入可听见的失真。

抖动 是故意添加一些噪声以平滑波形,当 32 位或 24 位音频文件转换为 16 位时。形状抖动应该给出最佳结果,并且它是最耗 CPU 的。三角形是质量和 CPU 周期之间的折衷,而矩形轻量级并且改动最小。你不必应用抖动;你的耳朵会告诉你它是否有所改进。

高质量转换设置与实时转换设置类似,但它们是在混音和导出时应用于音轨的,因此与实时转换设置不同,你的项目文件会发生变化。

接口

接口对话框(图 15-6

图 15-6. 接口对话框

音频输入/输出按钮的 ergonomics 排序

选中此选项将控制工具栏中的按钮按以下顺序排列:暂停、播放、停止、跳转到开始、跳转到结束、记录。未选中时,它们将按以下顺序排列:跳转到开始、播放、记录、暂停、停止、跳转到结束。

程序启动时显示“如何获取帮助”消息

选中此选项将显示一个消息框,其中包含指向 Audacity 帮助资源的链接,例如手册和维基。如果你想要本地副本,可能需要单独安装 Audacity 手册。最新版本将在网上。

仪表/波形 dB 范围

这是你在仪表工具栏和波形 dB 视图(轨道菜单)中调整显示比例的地方,从 -36 dB 到 -145 dB。

语言

如果你希望 Audacity 会话使用与操作系统默认语言不同的语言,这是一个很好的便利功能。你还需要在系统上安装语言字体。

手册位置

使用此功能将 帮助 > 手册 编程为查找 Audacity 手册的本地副本,或直接访问在线版本。

关闭最后一个窗口退出 Audacity

如果您取消选中此复选框,关闭最后一个打开的项目将使 Audacity 保持打开状态,您将需要选择文件 > 退出(或按 ctrl-Q)才能完全关闭。当您正在处理大量项目时,例如将一批黑胶唱片转移到 CD 上,这很有用,因为您可以在完成每个项目后关闭它,而无需关闭 Audacity。

在完成较长时间的活动后发出蜂鸣声

选中此选项,当任务完成时间超过一分钟时,Audacity 会发出蜂鸣声。

清洁语音模式

清洁语音模式创建了一个定制的、简化的 Audacity 界面,用于快速清理和快速 MP3 导出。在控制工具栏中添加了一个额外的按钮,菜单也被简化了(图 15-7

图 15-7. 清洁语音模式按钮

清洁语音模式有两个预制操作:清洁语音和 MP3 转换。

图 15-8. 清洁语音模式有两个预制操作:清洁语音和 MP3 转换。

MP3 转换只包含两个操作:归一化和导出为 128Kbps MP3。如果您通过点击“应用至当前项目”按钮将 CleanSpeech 或 MP3 转换应用于打开的项目,导出的文件将进入项目目录中名为cleaned的目录。您也可以从一个空项目开始,点击“应用至文件”,然后从文件选择器中选择要转换的文件。转换后的文件将被导出到与源音频文件相同的目录中。使用第二种方法,不会创建新的 Audacity 项目。

默认的 CleanSpeech 设置相当严厉,因为它们应用了噪声消除和电平化效果。噪声消除需要一个自定义的噪声配置文件才能有效,而且在这里无法构建自定义配置文件。电平化效果引入了大量的失真。它应用了归一化效果两次,这可能会增加噪声。尽管如此,您仍然可以修改这两个链中的任何一个,或者创建新的链,尽管在撰写本文时,Audacity 的链功能仍然相当不成熟,且文档也不太完善。

选择文件 > 编辑链以查看预制 CleanSpeech 和 MP3 转换的确切操作(图 15-9

图 15-9. MP3 转换和 CleanSpeech 选项

即使在其当前未完成的状态下,Audacity 开发者通过通过图形界面使这些自定义批处理作业可定制,也有正确的方法。要创建一个新的链,打开文件>编辑链对话框(图 15-10),然后在左侧面板中点击添加按钮。一个小消息窗口弹出,要求你为新链命名。在这个例子中,我创建了新的“测试”链。

创建一个新的自定义链

图 15-10. 创建一个新的自定义链

现在,我可以通过点击插入按钮(图 15-11)将一个命令添加到测试链中。这打开选择命令对话框。在正常模式下,它比在 CleanSpeech 模式下有更多的命令。

要找出你是否可以自定义命令参数,首先选择一个命令,然后点击编辑参数按钮。在图 15-12 中,我们使用放大效果这样做。这打开它的正常对话框,因此我们可以以通常的方式设置放大参数。

这并不适用于所有命令,但你可能会发现你可以创建一些有用的链来自动化常规任务。

选择命令对话框

图 15-11. 选择命令对话框

设置放大效果参数

图 15-12. 设置放大效果参数

音轨

音轨对话框(图 15-13)控制你的 Audacity 音轨在录音、编辑和播放时的行为:

设置你的音轨行为默认值

图 15-13. 设置你的音轨行为默认值

播放时更新显示

在播放时自动滚动。如果它使你的电脑运行太慢,你可以禁用它。尽管如此,如果你真的需要这样做,你可能真的需要考虑升级你的电脑。

自动垂直缩放以适应音轨

这可能是一个方便的选项:你的音轨会垂直调整大小以适应屏幕。但如果你的项目中有太多音轨,它们会变得非常小。音轨太少,它们会扩大以填充屏幕。

默认视图模式

选择你的默认波形显示,它具有与轨道菜单中相同的选项:波形,这是 Audacity 的默认选项;波形 dB;频谱;频谱对数(f);或音高 EAC。(参见轨道面板以了解更多信息。)

如果没有选择任何音频,则选择项目中的所有音频

如果这个选项未选中,所有需要选择的菜单项都将变为灰色,直到你选择某个选项。当它被选中时,当你没有选择任何内容时,所有轨道都将默认选中。

启用剪切线

这是一个很好的小功能,可以帮助你跟踪最近的剪切。当你进行剪切时,一条浅蓝色线标记位置。当你将光标移到其他地方时,蓝色线变为红色。

启用拖动左右选择边缘

这允许你使用鼠标扩展或减少选择。当这个选项未选中时,你必须使用键盘或选择栏。

“移动轨道焦点”会重复遍历轨道

当你有多个轨道时,你可以使用上下箭头键更改焦点,当光标到达顶部或底部轨道时,只要按下键,它就会自动继续循环遍历轨道。

编辑剪辑可以移动其他剪辑

当这个选项被选中时,你可以在剪辑之间粘贴,Audacity 会自动为新粘贴创建空间。当它未被选中时,如果没有足够的空间,你将无法在那里粘贴。

独奏按钮

这有一个下拉菜单,包含三个选项,用于控制轨道面板和混音板上的独奏按钮的行为:标准、简单、无。在标准模式下,点击多个轨道上的独奏按钮相当于选择它们,并且你可以这样选择多个轨道。在简单模式下,点击一个轨道上的独奏按钮会静音所有其他轨道。无选项移除所有独奏按钮,只留下静音按钮。

导入/导出

在这里,你可以设置一些有用的默认值用于导入和导出音频文件(图 15-14):

设置默认导入和导出行为:导入/导出

图 15-14. 设置默认导入和导出行为:导入/导出

在导入音频文件时

你必须选择前两个选项之一:“在编辑前复制未压缩音频文件(更安全)”或“直接从原始文件读取未压缩音频文件(更快)”。

第一个选项增加了冗余,并允许您在不损坏 Audacity 项目的情况下操作或删除源音频文件。第二个选项更快,且更节省磁盘空间。如果您不打算更改源文件,则应使用此选项。例如,假设您有一段您乐队的现场录音,您打算对其进行编辑,并从中制作一些 CD 和下载文件。如果您像我一样,您会保留原始文件完整无缺,包括所有瑕疵,并制作备份副本,因此您不需要 Audacity 为原始文件制作额外的副本。

在项目中标准化所有轨道

此设置将在将音频文件导入项目时根据效果 > 标准化的当前设置对所有音频文件进行标准化。我更喜欢将标准化作为大多数项目中的最后一步之一,尤其是在我将多个轨道混合到立体声时,因为混合轨道会使它们变得更响亮。但这个选项在您正在进行不需要大量编辑的项目时可能很有用,例如从已经编辑和混合的音频文件中汇编一个汇编。

在导出轨道到音频文件时

“始终将所有轨道混合到立体声或单声道通道”是当您主要创建立体声或单声道混合时的合理选择。“使用自定义混合”在导出时打开通道映射器(Audacity 称之为混音器),这对于多声道环绕导出以及您想要对立体声导出有更多控制时是必需的。

在导出步骤之前显示元数据编辑器

选中此选项意味着在导出时,元数据编辑器将为每个单独的歌曲轨道或文件打开,以便您可以单独验证或编辑每个文件的元数据。如果您正在导出大量单独的歌曲或轨道,这可能是一项庞大的工作。您应该首先在文件 > 打开元数据编辑器中输入所有轨道的共同信息,然后 Audacity 将自动为每首歌曲输入这些信息,并自动输入每个轨道编号。

项目

项目对话框控制自动保存间隔以及如何管理从其他项目衍生出来的项目(图 15-15):

在保存依赖于其他音频文件的项目时

我认为 Audacity 项目依赖于其他 Audacity 项目不是一个好主意。它们应该是自包含的。如果您需要节省磁盘空间,那么您可能希望您的 Audacity 项目共享依赖项,但我认为这是在寻找麻烦,因为如果任何东西发生变化,它将影响多个项目。安全的选择是“始终将所有音频复制到项目中(最安全)”。如果您想为每个项目单独决定,则“询问用户”是合适的。“检查依赖项”可以通过点击文件 > 检查依赖项来检查是否有任何项目具有依赖项。

自动保存

如果您希望 Audacity 在您选择的任何间隔自动保存项目副本,请点击此处。副本将放入一个单独的目录,Audacity 使用该目录进行损坏项目的自动恢复。它不会保存数据文件,这些文件具有 .au 扩展名,而是保存项目元数据,这些元数据保存在一个 XML 文件中。Linux 用户可以在 /.audacity-data/AutoSave/ 中查看这些自动保存文件;它们就像项目 .aup 文件一样。在 Windows XP 和 Vista 上,请查看 Documents and Settings<用户名>\Application Data\Audacity,在 Windows 7 上,请参考 Users<用户名>\AppData\Roaming\Audacity

设置默认导入和导出行为:项目

图 15-15. 设置默认导入和导出行为:项目

当 Audacity 运行时,您无法保存项目,因此充分利用每个机会通过按 Ctrl-C 或点击 文件 > 保存项目 来停止录音并保存项目是个好主意。

库对话框确认您是否已安装 LAME 和 FFMpeg,显示它们的安装位置,并显示它们的版本 (图 15-16).

库对话框显示版本号,3.98.2,以及完整文件路径。如果 LAME 未安装,则不会显示这些信息。

图 15-16. 库对话框显示版本号,3.98.2,以及完整文件路径。如果未安装 LAME,则不会显示这些信息。

如果缺少任何这些组件,只需点击下载按钮来查找并安装它们。

频谱图

此对话框控制您选择频谱或音高 EAC 视图时轨道显示的详细程度。这些对于深入频率分析非常有用。(第十一章 有关于频率分析的精彩介绍。) 这里有很多数学运算,我不太理解,但我对那些理解数学并改进使数字音频工程成为可能算法的聪明人表示感激。第一个设置,FFT(快速傅里叶变换)窗口,控制显示多少频率细节。较大的 FFT 大小显示更多低音频率,时间分辨率更少。

窗口类型列出了诸如矩形、汉宁、巴特利特、汉明、韦尔奇和高斯等选项。用我能想到的最简单的话来说,不深入数学,这些是数字信号的图形视图,旨在帮助进行详细分析。根据维基百科上的“窗口函数”文章(en.wikipedia.org/wiki/Window_function/),Blackman-Harris 是一个低分辨率、高动态范围窗口,而其他所有都是高分辨率和中等分辨率窗口。

最小/最大频率设置在你在有限频率范围内工作(如处理声音或单一乐器)时,可以用来修剪显示。

目录

在“目录”对话框(图 15-17

图 15-17. 临时文件位置

如果你使用的是非常慢的电脑,那么“音频缓存”设置是一个相当绝望的选择。选中此选项会将所有录音保留在内存中,直到你停止录音,然后才会写入磁盘。对于硬盘非常慢的电脑,这肯定会提高性能。但是,一旦出现小功率故障或内存不足,你的录音会丢失。在笔记本电脑上风险较小,因为它有电池,你可以设置一个最低内存阈值以触发写入磁盘。Audacity 有一个硬编码的最低 16MB RAM 限制,所以你不能使用低于这个设置的值。

警告

这件事非常简单,你可以在睡梦中完成——决定你希望 Audacity 为不同的操作显示哪些警告(图 15-18

图 15-18. 打开或关闭警告

效果

此对话框提供了启用或禁用 Nyquist、VAMP、LADSPA 或 VST 效果的选择。(Linux 用户将看不到 VST 效果,因为它们在 Linux 上不工作。)我不知道你为什么想要禁用这些中的任何一个,但如果你想要,你可以这样做。

键盘和鼠标

在这两个对话框中,你可以设置自定义键绑定并查看鼠标快捷键。你不能更改鼠标快捷键,但你可以随意自定义键盘快捷键。点击你想要创建快捷键的功能;比如说,是打开元数据编辑器。点击设置按钮旁边的框并按下你想要的快捷键。在图 15-19 中,我输入了 ctrl-S 并点击了设置按钮。然后 Audacity 友好地告诉我 ctrl-S 已经被占用。因为 Audacity 会为你找到任何冲突,所以这个过程很快。

更改键盘快捷键

图 15-19. 更改键盘快捷键

附录 A. 音频硬件

无标题图片

音频录音和处理硬件的世界很大,令人困惑,并且不舒服地横跨模拟和数字世界。并不总是清楚特定设备是否与电脑兼容,或者哪些设备是数字音频录音所必需的。

本附录包含各种价格范围内的声卡、调音台、模拟到数字/数字到模拟转换器、麦克风和便携式数字录音机的样本,以给您一个了解可用产品的概念。这远非一个全面的目录,但希望它能为您在理解音频设备方面提供一个良好的起点。

最简单的 Audacity 录音设置需要三样东西:运行 Audacity 的电脑、一个模拟到数字/数字到模拟转换器,以及某种类型的接口,用于将麦克风或乐器连接到您的 ADC/DAC。这可以简单到只是一台笔记本电脑和一个麦克风。您可以一开始就选择便宜简单的设备,然后随着时间的推移逐渐升级。

价格、型号、功能和操作系统支持都是不断变化的目标。我最喜欢的在线购物网站是 zZounds (www.zzounds.com/)。他们拥有庞大的库存,价格优惠,并提供最佳客户服务。B&H Photo Video 也是一流的 (www.bhphotovideo.com/)。这两个网站都是了解产品和定价的绝佳选择,并且产生了大量有用的客户评论。

PCI、PCI-e、PCMCIA 声卡

我喜欢使用 PCI 和 PCI-e 进行非常快速、无故障的多通道录音。PCI-e 的速度比 PCI 快,因为每个 PCI-e 插槽都有自己的专用总线,而 PCI 设备则共享带宽。两者都非常出色且使用起来最无烦恼。

PCMCIA 接口适用于笔记本电脑。PCI、PCI-e 和 PCMCIA 通常需要单独的分线盒来连接麦克风、调音台、预放大器和其他设备。其中一些,代替分线盒,使用分线电缆包。

PCI

Digigram VX222HR

24 位/192 kHz ADC/DAC,2/2 立体声平衡模拟和数字 I/O,包括分线电缆。$550。Windows 和 Linux。

M-Audio Delta 44

24 位/96 kHz ADC/DAC,4 进/4 出平衡和非平衡 1/4 英寸 TRS,包括分线盒。$149。Windows、Linux 和 Mac。

M-Audio Delta 1010LT

8 × 8 模拟 I/O,S/PDIF,24/96 kHz ADC/DAC,用于精确设备同步的字时钟,2 个麦克风/线路预放大器。包括分线电缆包。如果您想连接超过两个麦克风,则需要外部预放大器。$199。Windows、Linux 和 Mac。

M-Audio Delta 1010

24/96 ADC/DAC,10 进/10 出机架式分线盒,7.1 环绕声回放,S/PDIF 输入和输出,用于精确设备同步的字时钟。包括分线盒和电缆。$799。Windows、Linux 和 Mac。

PCI-e

AudioScience ASI5641

专业数字音频卡,具有四个立体声/八个单声道 AES/EBU 输入和输出,24/96 kHz ADC/DAC。需要使用分线盒。价格约为 1295 美元,加上 295 美元的分线盒。支持 Windows 和 Linux 操作系统。

RME Hammerfall Multiface II

RME Hammerfall Multiface II 音频接口是一款高端多通道录音接口,具有多种计算机接口选项:他们自己的 HDSP PCI、PCI-e 和 PCMCIA 卡。有关 Multiface II 的更多信息,请参阅 PCMCIA 部分。HDSP PCI/PCI-e 卡的价格大约为 300 美元。

PCMCIA

Digigram VXPocket 440

PCMCIA,S/PDIF 立体声输入和输出,24/48 kHz ADC/DAC,两个平衡麦克风/线路输入,包含分线电缆。售价 650 美元。支持 Windows 和 Linux 操作系统。

RME Hammerfall DSP Cardbus + Multiface II

RME HDSP PCMCIA Cardbus Type II 是 Multiface II 音频接口的笔记本电脑接口卡。它提供极低的延迟、高带宽和低 CPU 负载。售价 400 美元。支持 Windows、Linux 和 Mac 操作系统。

Multiface II 具有 24/96 kHz ADC/DAC,8 个模拟 I/O,1 个 ADAT,1 个 S/PDIF,字时钟,1 个立体声模拟输出用于耳机或立体声混音输出,16 通道 MIDI。售价约为 800 美元,通常可以捆绑 RME HDSP 一起以约 1100 美元的价格购买。您需要使用单独的前置放大器来连接麦克风。

Multiface II 也有 PCI 和 PCI-e 接口。

USB 录音接口

USB 接口便携且易于连接。符合标准的 USB 接口不需要任何特殊驱动程序,但许多 USB 接口确实需要。即使不需要,许多产品也附带驱动程序光盘。

Behringer UCA222

这款小巧的便携式 16/48 USB ADC/DAC 售价 35 美元。可放入笔记本电脑包中;连接一对 RCA 输入或一对 RCA 输出。用于连接唱机、磁带机、乐器或模拟调音台。

Behringer Xenyx X1204 USB Mixer

Xenyx 系列 USB 调音台有多种尺寸,提供了一套不错的模拟调音台组合;24 位 ADC/DAC;麦克风前置放大器;以及额外的功能,如特殊效果、均衡器、压缩器、监听端口、推子,和辅助发送。接入所有表演者,调整混音,这些小巧的调音台将输出一张 CD 级别的立体声录音。Xenyx 系列从 X1204 的 270 美元到 X1832 的 500 美元不等。支持 Windows、Linux 和 Mac 操作系统。

M-Audio Fast Track Ultra 8R

24 位/96 kHz USB 2.0 机架式,8 个前置放大器,8 个 XLR/TRS 组合插孔,2 个耳机输出。售价 499 美元。包含 Windows 和 Mac 操作系统的驱动程序,据报道在 Linux 操作系统上使用默认的 ALSA 驱动程序也能工作。

M-Audio MobilePre

我的这个小型双通道工作马。可接受多达四个设备,例如两个麦克风和两个乐器。16/48 ADC/DAC,增益控制有不错的旋钮,耳机监听端口,两个麦克风前置放大器,幻象电源,总线供电,立体声输入和输出,线路输入和输出。售价 179 美元。支持 Windows、Linux 和 Mac 操作系统。

PreSonus AudioBox 2×2

PreSonus 生产优质的音频硬件,这个小盒子性价比很高。您获得的是一个双通道总线供电的前置放大器 ADC/DAC,带有幻象电源;因为它体积小且无需外部电源,所以非常便携。它有两个组合的 TRS/TLR 插孔,适用于动圈麦克风、电容麦克风或乐器;有很好的旋钮来控制增益;两个 MIDI 端口;以及一个耳机监听端口。价格为 $149。支持 Windows、Linux 和 Mac 操作系统。

Pro-Ject Phono Box II USB Phono Preamp

16/48 kHz ADC 用于将标准唱盘连接到您的电脑,用于录音和播放。价格为 $199。支持 Windows、Linux 和 Mac 操作系统。

Shure X2U XLR-to-USB 信号适配器

精巧的 XLR-to-USB 麦克风适配器,带有幻象电源、16/48 ADC 和适用于动圈麦克风和电容麦克风的麦克风前置放大器。将您喜欢的麦克风直接插入电脑。价格为 $150。支持 Windows、Linux 和 Mac 操作系统。

FireWire 录音接口

FireWire 对于高端多通道录音非常出色,尽管让 FireWire 设备正常工作可能有点棘手。新的 FireWire 800 标准创造了可能的最宽数据路径,这对于多通道录音是一个巨大的好处,允许您以全 24/192 分辨率记录比任何其他类型的计算机接口更多的通道。

Echo AudioFire 2

总线供电便携式 4 × 6,24/96 ADC/DAC,S/PDIF 输入/输出,MIDI,耳机端口,2 × 1/4″ TRS 输入,2 × 1/4″ TRS 输出。您需要麦克风前置放大器来连接麦克风。支持 Windows、Linux 和 Mac 操作系统。

Edirol FA-101

总线供电,两个 XLR/TRS 组合插孔,S/PDIF,24/192 ADC/DAC,2 个幻象电源麦克风前置放大器,8 × 8 平衡模拟 I/O,MIDI。这款小巧的高端便携式设备价格约为 $400。支持 Windows、Linux 和 Mac 操作系统。

Focusrite Saffire Pro 26 I/O

8 个 XLR 麦克风前置放大器,8 个 TRS 线路/乐器输入,8 个 TRS 输出,2 × ADAT,24/192 ADC/DAC,1 个 S/PDIF 输入/输出,字时钟,两个耳机端口,以及 10 个增益控制旋钮。插入您的麦克风和乐器并开始录音。价格约为 $500。支持 Windows、Linux 和 Mac 操作系统。

RME Fireface 800

24/192 ADC/DAC,8 1/4″ TRS 模拟输入,8 1/4″ TRS 数字输出,2 × ADAT,2 × S/PDIF,幻象电源,麦克风前置放大器……最多可以连接 35 个信号源到 Fireface 800 并记录到 28 个独立的轨道上。这是一款用于重型录音的严肃设备。FireWire 800 是最新的 FireWire 规范。它以 800Mbps 的速度提供是旧 FireWire 400 规范的两倍吞吐量。它与 FireWire 400 兼容。您不会看到更低的延迟,但带宽加倍,适用于多通道录音。这款优质设备售价约为 $1,700。支持 Windows 和 Mac,未来可能支持 Linux。

独立 ADC/DAC

数字音频录音的关键组件是一个好的 ADC/DAC。与所有电子产品一样,它们有多种形式,从优秀的组合设备到您可以在工作室中塞入的尽可能多的独立专用组件。

Behringer ADA8000

当你需要连接很多麦克风时,你需要类似这样的设备。机架式 8 通道 24/48 ADC/DAC,8 个麦克风前级放大器,幻象电源。所有八个通道都可以路由到 ADAT 输出,以便连接到混音器或其他设备,并且每个通道都有独立的线路输出。价格为$299。要将此设备连接到您的计算机,您需要一个带有 ADAT 端口的音频接口,如 Multiface II 或 Focusrite Saffire Pro,或者您计算机中的 ADAT 接口卡。这些接口有所有常见的类型:PCI、PCI-e 和 FireWire。价格从几百美元到几百美元不等。支持 Windows、Linux 和 Mac 操作系统。

Apogee DA16X

对于专业录音室,有许多独立的 ADC/DAC 设备,它们仅用于模拟/数字转换,就像这个设备一样。16 通道 24/192 ADC/DAC,2 个 D-sub 25 针模拟输出,1 个 D-sub 25 针输入,ADAT 和字时钟用于同步多个设备。您可能使用此转换器的一种方式是将您的表演者连接到带有麦克风前级的模拟混音器,或者可能是一个独立的麦克风前级,将混音器连接到 Apogee,然后使用 FireWire 或 PCI 接口卡将 Apogee 连接到您的计算机。此设备的价格大约为$3,000。支持 Windows 和 Mac 操作系统。

附录 B. 术语表

A–E

ADC/DAC

模拟/数字转换器,数字/模拟转换器。模拟声音,如歌手或乐器的声音,被转换成数字形式以进行录音和编辑,然后转换回模拟形式进行播放。CD 播放器是一个 DAC。你的电脑声卡是一个 ADC/DAC。ADC 是一件关键设备。一个好的 ADC 可以进行良好的干净准确的转换,不会引入噪声。差的 ADC 声音奇怪,并增加噪声。有些设计是为了添加一些色彩,例如模仿某些经典的管状放大器或旧时的录音风格。

振幅

振幅,就声音而言,可以被视为压力;压力越大,声音越响。它也被描述为强度能量。你可以在波形中看到振幅,例如图 B-1。更高的峰值意味着更大的振幅。这两条音轨都是使用生成 > 音调对话框创建的 1,000 Hz 正弦波。上面的音轨振幅为 1.0,下面的音轨振幅为 0.2。这两个音调除了振幅外完全相同。

两个振幅不同的相同正弦波

图 B-1. 两个振幅不同的相同正弦波

这是一种物理压力,你可以在某些条件下体验到。例如,当低音炮音量足够大时,你可以看到其圆锥体跳动,当你把手放在它前面时,你可以感觉到空气的流动。(而且数英里外的人也可以“享受”听它。)比尔·奈伊《科学小子》有一个很酷的特技,他用自制的声波炮熄灭蜡烛。一声巨大的声音爆炸会使水面产生涟漪。

声波炮已经以多种创造性的方式进行了测试,例如被用作非致命的警察武器来驱散人群。理论上,足够强大的声音冲击波在正确的频率下会震破耳膜。在较低功率水平,并且正确的频率下,它将产生恶心和不适以及紧张的感觉。

环境,环境声音

来自你周围环境的任何声音。环境声音增加了色彩和能量,例如人群噪音、树木中的鸟鸣和风声,或者在特殊地点(如露天剧场或古老的教堂)录制的特殊音质。环境声音也可能是不愉快的,如交通噪音和狗吠声。

模拟孔

娱乐行业发明的一个可怕的恶魔,它展示了对于技术和客户服务的基本误解。数字媒体播放器必须将音频和视频转换为模拟形式,这样我们才能听到和看到它们;这就是从你的扬声器中出来的,就是你电视上看到的内容。如果我们能看到它,它就可以被拍照,如果我们能听到它,麦克风也可以。当然,以这种方式制作副本会导致质量较低的副本,但它表明没有通过技术手段防止复制的方法。该行业努力“关闭模拟孔”的努力导致了受损的家庭娱乐接收器,这些接收器向模拟输出发送故意降级的信号,或者禁用了模拟输出。这种损害不会区分你有权以任何方式使用的媒体,比如你的 DVD 上的家庭电影和自制的音乐 CD,以及他们试图“保护”的大规模生产的垃圾。

无论如何都是徒劳的,因为所有形式的复制保护最终都会被破解,然后你可以轻易地制作出完美的数字副本。

比特深度

控制动态范围、信噪比以及整体保真度和准确性。更宽的动态范围会导致更高的信噪比,这通常也被称为更低的噪声地板。换句话说,你得到更多你想要的声音,而你的设备引入的噪声更少。在过去的磁带录音时代,总是有磁带嘶嘶声和来自磁带机的某些噪声。在黑胶 LP 唱片上,有来自乙烯基缺陷和唱机嗡嗡声的噪声。在数字音频中,噪声来自你的电子设备;好的电子设备被描述为提供干净的声音,没有任何引入的噪声。

音频制作的常见比特深度是 16 位、24 位、32 位和 32 位浮点。更大的比特深度会导致更准确、更忠实的从模拟转换。

比特深度与采样率密切相关。你的模拟-数字转换器“采样”音频信号,每秒进行多次采样。例如,CD 质量是每秒 44,100 次的 16 位采样率。每个单独的样本被赋予一个 16 位的二进制值。转换为十进制,每个样本等于或小于 65,535(0–65,535)。

24 位深度有 0–16,777,216 个可能值,32 位有 0–4,294,967,295 个。请注意,这些是无符号整数值。例如,32 位浮点数是一个 24 位的尾数加上一个 8 位的指数。Audacity 和许多其他音频录制应用程序以及 DAW 内部使用 32 位浮点,因为浮点小数点允许非常高的精度,并创造了各种额外的空间,这样你就可以以各种方式操作你的音频文件,而不会降低它们的质量。

16 位深度的潜在动态范围为 96 分贝;24 位,144 分贝;32 位,192 分贝。音频硬件的硬限制约为 115 分贝。32 位浮点数的潜在动态范围约为 1,500 分贝,这意味着极低的噪声地板和极低的削波潜力。

在 Audacity 的一些配置对话框中,位深度被称为采样格式。位深度是正确的术语。

通道

任何信号的单一路径。例如,一个单声道麦克风插入单声道输入是一个输入通道。一个立体声信号路由到两个扬声器有两个播放通道。具有离散 5.1 环绕声的音乐系统有六个播放通道。如果你将 10 个表演者插入到一个混音器中,然后将该混音器插入到一个单声道通道中,尽管整个乐队都在其中录音,但这仍然是一个输入通道。

许多环绕声接收器可以从立体声录音中模拟多声道环绕声。这并不是离散多声道环绕声,而是简单的双声道立体声。

削波

当数字音频信号超过 0 dBFS 时,它将被截断到你所记录的位深度的最大值。这听起来可能相当糟糕,因此避免削波在数字音频中非常重要。

交叉淡入淡出

这是一个既好又常见的效果:淡出与淡入重叠。Audacity 没有交叉淡入淡出效果,但使用包络和时间移动工具很容易创建交叉淡入淡出。你需要两个轨道:手动在一个轨道上创建淡出,在另一个轨道上创建淡入,然后使用时间移动工具调整重叠程度。

数字音频工作站(DAW

数字音频工作站,这是一种组合录音机和混音器的设备。这可以是一个独立的硬件设备,也可以是计算机上的软件应用程序或套件。

dBFS(分贝相对于全量程

相对于全量程的分贝;参见分贝。

分贝

分贝用于衡量振幅,即声音的响度。1 分贝等于 1/10 贝尔,贝尔是以亚历山大·格拉汉姆·贝尔的名字命名的。分贝也用于测量电压和信号强度。

在音频中,分贝不是一个绝对测量值,而是我们正在测量的声音与任意参考水平之间的比率。我们能感知到的最小变化约为 1 分贝。3 分贝的提升大约是两倍响度,而 3 分贝的降低大约是半倍响度。声音的强度或振幅并不与我们对响度的感知成正比。响度是一种心理声学反应,声音强度增加约 10 倍才能使其听起来响度加倍。

在数字音频中,我们使用相对于全量程的分贝,缩写为 dBFS。0 是我们能到达而不削波的最大响度,数字音频的 dB 值以负数表示。

你可能会看到表格显示从人能听到的最微弱的耳语,即零分贝,到痛阈,通常表示为 120 分贝的各种声音的分贝水平。这些不是我们在数字音频中使用的 dBFS 刻度,而是 dBA 刻度,它通常用于测量环境和工业噪音。

离散

这里的“离散”是指分开的,而不是“细致”的意思,即能够闭上嘴巴。大多数立体声系统有两个离散的播放通道,而离散 5.1 环绕声意味着六个分开的播放通道。有时 5.1 环绕声是从立体声轨道模拟的,所以这并不是离散的 5.1 环绕声。

下混音

将多个音频轨道合并成更少的轨道,例如将六个轨道下混音成双声道立体声。

下采样

转换为较低的采样率。例如,CD 音频必须是 16 位/ 44,100 Hz 的采样率,所以 48 kHz 的音频文件必须下采样到 44.1 kHz。重采样可能会损害音频质量,所以你越少重采样音频文件越好。从主文件中重采样一次以导出不同的音频文件格式是可以的;如果你对重采样的文件再次进行重采样,你可能会听到差异。

DRM

数字版权管理,或数字限制管理,这取决于你的观点。DRM 是各种旨在防止非法复制受版权保护媒体的保护技术。

F–J

频率

声音频率以赫兹(Hz)为单位测量,即每秒的周期数,或者一个完整的声波在一秒内通过一个给定点的时长。高频产生更高音调的音。赫兹的缩写为 Hz。千赫兹是 kHz,兆赫兹是 MHz,吉赫兹是 GHz。88 键钢琴上最高的音符是 C8,频率为 4,186 Hz,或 4.186 kHz。吉尼斯世界纪录保持者,人类声音产生最低音符的罗杰·梅尼斯,唱出了 0.393 Hz 的 F-sharp 音符。没错,不到 1 赫兹,远超过 88 键钢琴键盘上最低的 A0 音符,其频率为 27.5 Hz。

图 B-2 展示了两个振幅相同但频率不同的正弦波。顶部的波形是 100 赫兹,底部的是 1,000 赫兹。

相同振幅但频率不同的两个正弦波。

图 B-2. 相同振幅但频率不同的两个正弦波。

注意

梅尼斯先生为赢得吉尼斯世界纪录而录制的官方录音是吉尼斯公司的“财产”,因此他不能使用他自己的声音的这段录音。

基频

几乎所有声音都是复杂的,具有多个频率。当你吹小号或弹吉他时,每个音符都有多个谐波频率,那么哪个是音符呢?它是最低频率;这就是我们所说的音高,这就是我们调整乐器的原因。音高是主观的而不是客观的;音高是我们感知到的音符。通常来说,很容易说,“那个音符是中 C”,或者 C 下面的 A,或者 F#,或者诸如此类。

但对于某些乐器来说,检测音高并不那么容易。例如,当你敲击钹或铜锣时,你能挑出一个明显的音符吗?对于大多数钹和铜锣,泛音和谐波非常复杂,以至于你无法分辨。

谐波频率

谐波频率是基频的倍数。例如,当基频为 100 Hz 时,第一谐波频率是 200 Hz,第二谐波频率是 300 Hz,以此类推。

赫兹

见频率。

高 Z,低 Z

见阻抗。

热插拔

在电源开启时插拔电子设备。通常这并不是一个好主意,因为它可能会发出很大的噼啪声,甚至造成损坏,因此养成一个良好的习惯是在连接或断开任何东西之前总是关闭设备的电源。

阻抗

阻抗是电气电阻。简而言之,无论你连接什么音频硬件,都要始终匹配你的阻抗。

你需要特别注意麦克风阻抗。低阻抗更好:600 欧姆或以下。中等阻抗是 600 到 10,000 欧姆,高阻抗是 10,000 欧姆以上。一些高端麦克风支持多个阻抗等级,并具有开关来选择你想要使用的阻抗。当你看到 High-Z 和 Low-Z 时,这是高阻抗和低阻抗的简称。但这些都是不精确的,因此最好知道你的确切阻抗值。

高阻抗麦克风通常是质量较低的麦克风,并且在较长的电缆传输中会损失信号强度。如果你不能精确匹配阻抗,请将麦克风连接到具有相同或更高阻抗的输入。如果你反其道而行之,你会损失信号强度。尽管如此,不匹配的麦克风和输入阻抗不会造成严重的问题,尽管你可能会经历信号强度下降和音频质量降低。

线匹配变压器是一种有用的设备,用于连接具有不匹配阻抗的设备并将它们转换为匹配。

知识产权

一个不精确、误用、无意义的宣传术语。相关的法律术语是商标版权专利

K–O

延迟

拖延,延迟。低延迟对于叠加录音和监控录音会话非常重要。许多因素会影响延迟:你电脑 CPU 的速度,你的操作系统有多简洁,声卡驱动程序,计算机总线(USB、PCI、FireWire),特殊效果处理器,以及其他外设音频设备。

元数据

关于数据的资料;一种在文件头中存储有关计算机文件信息的方法。Audacity 有一个元数据编辑器,用于编辑录音会话信息,如艺术家、标题、日期和流派。

混音

下混相同。

重叠录音

每次制作多轨录音时,只录制几轨。这就是一个人可以一次录制一轨,最终自己录制完整交响乐的方法。许多商业录音都是分块录制的,表演者可能从未在同一录音会上出现,甚至使用的是不同的录音室。在 Audacity 中,您可以录制一个乐器轨,然后在录制第二轨的同时播放它。这种方式的重叠录音总会有一些延迟,因此 Audacity 提供了可定制的延迟校正功能。

P–T

峰值电平

您录音中的最高音量级别。通常峰值是瞬态事件,比 RMS 水平更高、更突然。在 Audacity 波形中,峰值和 RMS 水平以两种不同的蓝色阴影表示。

相位

相位关乎时间,是波形相对于其开始位置的时间点。当波形的相位不为零时,它已经被向前或向后移动了时间。我们在 Audacity 中使用时间移动工具来完成这一操作。声波以各种复杂和有趣的方式相互作用,相位偏移常被用来创建音频特殊效果。例如,您可以通过复制音频轨,稍微偏移复制的相位,然后将复制和原始音频混合在一起,来创建令人愉悦的回声。

两个完全同相的波形会合并它们的振幅,听起来更响亮。随机混合的声音可能会创造出全新的声音。两个相对于彼此偏移 180 度的波形会相互抵消。噪声消除设备就是这样做的,尽管效果因声音的复杂性和不完全匹配而有所不同。当扬声器放置不正确时,您可能会听到歌曲的一部分消失,比如主唱的声音变得模糊,这是由于相位偏移造成的。

当您放置麦克风时,必须考虑相位,尤其是如果您使用多个麦克风。例如,在鼓组上使用多个麦克风是一种常见做法,一些放在地板上,一些放在上方。如果它们的位置不正确,它们将不同步,并产生一些延迟或相位偏移,导致部分抵消,使得鼓声听起来单薄而微弱。

音高

音高和频率通常被认为是同一件事,但它们并不是。频率可以客观测量,而音高通常是主观的。耳朵可能会被骗,正如法国作曲家让-克劳德·里斯特所展示的那样。里斯特先生因创造听觉错觉而闻名,如里斯特节奏,听起来好像它的节奏永远在加快,而实际上它保持着相同的节奏。人类耳朵会感知到高音随着音量的增加而变高,而低音听起来好像它的音高随着音量的增加而降低。你可以在 Audacity 中通过生成不同频率的正弦波并逐渐增加和减少音量来轻松尝试这一点。

在音乐中,我们认为音高是音乐音符,所以我们调整我们的乐器到一个中 C 音的音高,或者 C 音下的 G 音,或者任何音符/音高的音高。

心理声学

研究人类如何感知声音。我们的大部分感知都是相对的;例如,在嘈杂的商店工作一天后,走出交通噪音的事件并不像离开安静的图书馆那样戏剧性。一些声音会掩盖其他声音,所以我们可能会使用白噪音来掩盖其他噪音。

音频非常主观,录音可以根据心理声学进行调整以利用其优势。现代高科技助听器使用心理声学模型使噪音听起来更自然。心理声学模型用于使有损音频格式如 MP3 和 Ogg Vorbis 听起来更好。

RMS

均方根,或你录音随时间变化的平均音量。与峰值水平形成对比,峰值水平是最高音量水平。Audacity 使用两种不同深度的蓝色在波形中表示均方根和峰值水平。

采样格式

参见比特深度。

采样率

每秒钟模拟到数字转换器“采样”模拟信号的次数。采样率决定了你录音的频率范围。理论上,当采样率至少是信号中最高频率的两倍时,可以实现模拟音频信号的完美数字表示。人类最佳的听觉范围可达 20-24 kHz,因此采样率为 40-48 kHz 可以(理论上)重现人类听觉的全部范围。

节奏

音乐的速度,以每分钟的节拍数表示。你可能已经注意到,节奏和能量并不总是相关——有些节奏慢的歌曲能量很大,而有些节奏快的歌曲感觉拖沓。当你注意到这一点时,更仔细地听——这是表演者投射出的某种品质吗?节奏部分?这是否是因为歌曲在小调还是大调上?

痛阈

我们感到疼痛的声音压力水平(幅度)。这在不同的人之间略有差异,并且在不同频率上变化很小。

音色

音色,发音为 TAM-ber,是一个用来描述声音质量的通用术语,例如温暖、寒冷、柔和、脆弱、沙哑、丰满、丰富、单薄、呼吸感、粗壮等等。音色描述了区分不同乐器即使它们演奏相同的音符时的特性,例如大提琴、中提琴和小提琴;双簧管和低音大管;或者非常相似的乐器,如两把原声吉他。

尝试听一下任何老式的 Allman Brothers Band 录音,看看你是否能分辨出两位主吉他手杜安·艾尔曼和迪基·贝茨之间的区别。Tiptons 萨克斯四重奏由四位萨克斯风手和一位鼓手组成,因此他们的录音非常适合磨练你的听力技巧。当你听 B-52s 时,你能分辨出辛迪·威尔逊和凯特·皮尔森吗?

轨道

轨道,就像频道一样,是任何单个音频路径或单元。在 Audacity 中,单声道轨道就是一个单独的轨道。在 Audacity 中,立体声轨道也是一个单独的轨道,尽管它有两个独立的通道,因为 Audacity 将其视为一个单一单元,你对它所做的任何操作都会同样应用于两个通道。当你烧录音频 CD 时,你可以选择 TAO(一次性轨道),这意味着激光会连续烧录整个轨道,没有暂停。这个单独的 CD 轨道可以包含多首歌曲,而一首单独的歌曲也是一个轨道。

瞬态响应

由突然事件(如鼓点、用力弹拨的弦或被碰到的麦克风)引起的波形中的急剧高能量峰值。

U–Z

上采样

转换为更高的采样率;例如,将 44.1 kHz 的音频文件重新采样到 48 kHz。上采样是没有意义的,因为它不会提高音频质量,实际上还可能引入一些缺陷。你应该只在必须满足某些特定任务的要求时才进行上采样,例如将 22,050 Hz 的文件上采样到 CD 音频,它必须是 44.1 kHz。

VU 表

VU 代表音量单位。你可能还记得从模拟磁带录音的老式 VU 表,我们用它来监控录音音量水平。VU 表通常有一个 20 到+3 的刻度,一个移动的指针,还有一个小红灯表示削波或峰值。尽管避免削波对于模拟录音来说不像数字录音那样关键,但 VU 表的响应时间相当慢。

附录 C. 数字音频的七个神话

无标题图片

有许多持续存在的、愚蠢的音频神话拒绝消亡。有趣的是,几个盲听测试就能驳斥它们,或者正如老技术宅的说法,“一次实验胜过千言万语。”以下是我最喜欢的。

金耳神话

一些音响爱好者喜欢沉迷于规格,并确信他们也能像蝙蝠一样听到超高频,像任何听到超低频的动物一样,他们需要每个可能的最小赫兹,而且必须通过特殊的有机电流过滤,否则他们的听觉体验就会毁掉。他们的设备必须是精英级的、价格昂贵的,而神圣的听音室必须特别设计。他们比普通人更敏感,而我们根本不理解他们所经历的。

销售人员和设备评论员无情地利用这种态度。这是卖高价设备的一种经过验证的方法。这些销售人员和评论员并没有任何特殊听力能力,只是对金钱的气味有敏锐的敏感性。

当然,确实每个人的听觉敏锐度和感知能力都不同,但在任何随机组合的、听力良好且未受损的人类中,区别在于他们的耳朵有多“受过教育”。这适用于我们的所有感官——当你知道该寻找什么时,你就能成为顶尖的观鸟者。当你学会区分葡萄酒的不同风味、香气和特性时,它就变成了多方面的乐趣,而不仅仅是简单的愉快刺激。经验丰富的骑手学会如何解读马发出的所有信号——情绪、意图、前方是什么——以及如何向马传达信息。就像我们做的其他所有事情一样,听也是学习的过程。你可能一开始无法区分中提琴和小提琴,但有了经验,你就能学会识别乐队或管弦乐队的个别音乐家。即使它是比利·蒂普顿纪念萨克斯风四重奏团。没错,四个萨克斯风演奏者,没有其他东西;两个中音萨克斯风,一个男高音和一个男低音萨克斯风。对于没有经验的耳朵来说,它只是一片萨克斯风的模糊声音,但稍加聆听,你就能立刻知道谁在演奏什么。

在古老的老式模拟时代,他们没有超级无敌的高保真录音室,当然也没有超级无敌的高保真播放设备。那些古老时代的最佳录音都由有才华、技艺娴熟的乐手和有才华、技艺娴熟的工程师制作,他们知道如何最大限度地发挥设备的作用。如果规格是唯一重要的,我们不妨听听纯正弦波。没有捷径可以节省时间来聆听、比较、实验和学习如何“聆听”。

烧录神话

这又是一个值得用木桩刺穿其要害的例子。音频电子设备和扬声器在全新时和使用几十年后听起来是一样的,除非有损坏或组件故障。给它们一段“烧录”时间,这仅仅是打开它们然后让它们保持开启状态,无论需要多长的神奇烧录间隔,都是愚蠢的,而且对它们的声音没有任何改变。

真空管放大器爱好者特别容易陷入烧录的狂热,他们会坚持认为新的放大器听起来“冷”,24 小时或 whatever 之后听起来“温暖”。事实并非如此;它们都是一样的。有很多事情会影响我们对声音的感知:温度、湿度、心情、我们是否休息充足或疲惫,我们是否整天处于安静或嘈杂的环境中。音频电子设备基本上总是相同的。

真空管优越性的神话

真空管放大器已经过时了。固态放大器能做的一切,价格更低、性能更好,且失真更少。真空管放大器在其使用寿命内需要更多的维护,因为真空管会烧坏并失去功率,你可能甚至需要重新调整它们的插座。你可能已经听到了对“真空管声音”的抒情颂歌。对于那些喜欢真空管的人来说,真空管放大器是完美的。如果你喜欢“真空管声音”,那很可能是放大器产生的失真。如果你想让你的放大器保持中性,尽可能准确地重现你的音频,你想要的是固态放大器。

超级电缆的神话

如果你真的想花大笔钱在电缆上,欢迎你。你可能从用美元纸币糊墙、用二十美元点燃雪茄或用本杰明·富兰克林的钱制作时尚服装中获得更多的乐趣,因为花大把的钱在音频电缆上并不能使它们比合理定价的电缆更好。你想要避免奇怪的、质量差的、无品牌的品牌,但除此之外,任何按照适当规格制造的电缆都与其他电缆相等。寻找良好的构造、坚固的连接器、良好的绝缘和印在套管上的规格和标识信息。有时还有一些有用的选项,比如直角插头或旋转插头。如果你想浪费钱,请务必选择比高价音频电缆更有价值的东西。

镀金插头增加了光泽、更高的价格标签和一些抗腐蚀性。它们不会让声音变得更好。

模拟优越性的神话

模拟音频在保真度、信噪比、失真少以及编辑、操作和再现的简便性方面都无法与数字音频竞争。有些人喜欢模拟的瑕疵,比如将模拟电路推到极限时的“丰满”声音、失真、反馈等。不用担心,每个人都有权有自己的偏好。尽管值得指出的是,这些可以在数字音频中重现。

你不需要音调控制的神话

这一点真的让我很恼火。你走进高端的傲慢音响店,想要试听一些高质量的设备。嘿,为什么不呢,你只有试听了才知道,对吧?你被带到那个声学完美的房间。在那里,你坐在精确定位的听音椅上,面对着一排排的扬声器、功放、前级放大器,没有接收器,因为那些不够傲慢,还有高端 CD 播放器。这些设备都连接到一个切换系统,这样你可以轻松尝试不同的组合。到目前为止,一切都很好。你的销售人员会喜欢一些高于常人的东西;可能是爵士乐,也许是一些古典音乐,也许是一些另类的独立厂牌。当然不会是 Top 40 或青少年流行音乐。

音乐就这样继续播放,你沉醉在愉悦的极乐之中。但当你聆听时,你注意到这并不完全正确。你可能想要少一点高音,也许多一点低音。也许中音稍微有点弱,你想要提高一点。不幸的是,运气不佳,因为那些优秀的功放只能控制音量和平衡。你没有音调控制。为什么?因为,正如销售人员解释的那样,真正的音响爱好者会按照音乐“应该被聆听的方式”来听音乐。所以,你没有音调控制,如果你想要,那么你就是有缺陷的。虽然不至于缺陷到花几千美元买一个没有音调控制的高保真系统;幸运的是,销售人员很慷慨,允许你这样做。

不幸的是,这是一个完全的神话。大多数录音并不是“完美工程”的;它们都是妥协的结果。因为即使是最佳工程的录音也无法抵御它们播放的环境或你高保真组件的个体特性。它们的声音会根据播放的设备、房间、温度和湿度、你的心情——每天都有点不同,上帝给了我们音调控制,这样我们就可以按照我们想要的方式听录音。也许你有一些强烈的情绪需要发泄,需要一些激进的低音炮。也许你想要它轻柔舒缓。也许你只是喜欢扭动旋钮。这是你的权利,你不应该让那些自负的销售人员把它从你那里夺走。

他人比你更懂得的神话

大多数情况下,挑剔的音响爱好者对错误的事情挑剔。有两种人可以教你实际有用的知识,那就是音乐家和录音师。我是指真正的音乐家和真正的录音师,不是那些认为当旋钮转到 11 时,意味着功放比转到 10 的功放更响的“想要成为”的人。录音师既是艺术家也是工程师,即使是平庸的录音师也能教你很多关于录音的细节。

需要练习、实验和大量的聆听,最终关于什么才是好的决定完全取决于你。你必须学会训练自己的耳朵和品味,不要依赖别人的意见,因为他们体验音频的方式与你不同。尤其是如果他们试图向你推销某样东西的话。

附录 D. 参考和资源

书籍

Aldrich, Nika. 数字音频解析:音频工程师指南. 第 2 版. 印第安纳波利斯,IN: Sweetwater Sound, 2004.

Everest, F.Alton 和 Ken C.Pohlmann. 声学手册大师. 第 5 版. 纽约: 麦格劳-希尔, 2009.

Grant, Rickford (与 Phil Bull 合著). 非技术人员的 Ubuntu 指南:轻松完成任务指南. 第 4 版. 旧金山: No Starch Press, 2010.

Pohlmann, Ken C. 数字音频原理. 第 5 版. 纽约: 麦格劳-希尔, 2005.

在线资源

“Audacity 论坛。” forum.audacityteam.org/

“Audacity 用户手册。” manual.audacityteam.org/

Linuxaudio.org www.linuxaudio.org/

图片来源

感谢维基媒体共享资源(http://commons.wikimedia.org/wiki/Main_Page/)及其贡献者,他们免费分享数千张美丽且有用的照片和插图,并允许我在本书中使用其中的一些。

以下图像根据 GNU 自由文档许可发布:

  • 第二章,图 2-11

  • 第十一章,图 11-30

以下图像根据 Creative Commons 署名-相同方式共享 3.0、署名-相同方式共享 2.5、署名-相同方式共享 2.0 和署名-相同方式共享 1.0 许可发布:

  • 第十一章,图 11-6

  • 第十一章,图 11-11

GNU 自由文档许可证

版本 1.3,2008 年 11 月 3 日

版权(C)2000,2001,2002,2007,2008 自由软件基金会,Inc. http://fsf.org/

每个人都允许复制和分发本许可文件的准确副本,但不得修改。

0. 前言

本许可的目的在于使手册、教科书或其他功能性实用文档“自由”,即确保每个人都能有效地复制和重新分发,无论是否修改,无论是商业用途还是非商业用途。其次,本许可为作者和出版商保留了一种方式,以获得其工作的认可,同时不因他人所做的修改而承担责任。

本许可是一种“copyleft”,这意味着文档的衍生作品本身也必须是自由的,具有相同的意义。它补充了 GNU 通用公共许可证,这是一种为免费软件设计的 copyleft 许可证。

我们设计此许可,以便用于免费软件的手册,因为免费软件需要自由文档:一个自由程序应附带提供与软件相同自由的手册。但此许可不仅限于软件手册;它可以用于任何文本作品,无论主题或是否以印刷书籍的形式发布。我们主要推荐此许可用于旨在指导或参考的作品。

1. 适用范围和定义

本许可证适用于任何包含版权持有人放置的通知的手册或其他作品,无论其介质如何,该通知表明该作品可以在本许可证的条款下分发。此类通知授予一个全球性的、免版税的、无限期的许可,允许在本文档中规定的条件下使用该作品。以下所述的“文档”指的是任何此类手册或作品。公众成员是许可证持有人,被称为“你”。如果你复制、修改或以需要版权法许可的方式分发作品,则你接受此许可证。

“修改过的文档”是指包含文档或其一部分的作品,无论是逐字复制,还是经过修改和/或翻译成另一种语言。

“次要部分”是指文档中名为附录或前言部分的章节,专门处理文档的出版商或作者与文档的整体主题(或相关事项)之间的关系,并且不包含可能直接属于该整体主题的内容。(因此,如果文档部分是数学教科书,则次要部分不得解释任何数学。)这种关系可能是与主题或相关事项的历史联系,或者是关于它们的法律、商业、哲学、道德或政治立场。

“不变部分”是指某些标题被指定为不变部分的次要部分,在通知中表明文档是在本许可证下发布的。如果一个部分不符合上述次要部分的定义,则不允许将其指定为不变部分。文档可能不包含任何不变部分。如果文档没有标识任何不变部分,则没有不变部分。

“封面文本”是指某些短文段落,这些段落列在通知中,作为封面文本或背面文本,表明文档是在本许可证下发布的。封面文本最多可以有 5 个单词,背面文本最多可以有 25 个单词。

“透明”的文档副本是指一种机器可读的副本,其规范对公众可用,适合使用通用文本编辑器或(对于由像素组成的图像)通用绘图程序或(对于绘图)一些广泛可用的绘图编辑器直接修改文档,并且适合输入到文本格式化器或自动翻译成适合输入到文本格式化器的多种格式。如果透明文件格式的标记或无标记已被安排以阻止或阻止读者进行后续修改,则该副本不是透明的。如果用于大量文本,则图像格式不是透明的。不透明的副本称为“不透明”。

透明副本的合适格式示例包括无标记的纯 ASCII、Texinfo 输入格式、LaTeX 输入格式、使用公开可用的 DTD 的 SGML 或 XML,以及为人类修改而设计的标准符合的简单 HTML、PostScript 或 PDF。透明图像格式的示例包括 PNG、XCF 和 JPG。不透明格式包括只能由专有文字处理器读取和编辑的专有格式,以及 DTD 和/或处理工具通常不可用的 SGML 或 XML,以及某些文字处理器为输出目的而生成的机器生成的 HTML、PostScript 或 PDF。

“封面”对于印刷书籍来说,指的是封面本身,以及为了清晰显示本许可证要求出现在封面上的材料所需的所有后续页面。对于没有此类封面页的格式,"封面"指的是靠近作品标题最突出位置的文字,位于正文开始之前。

“出版者”指的是向公众分发文档副本的任何个人或实体。

标题为“XYZ”的部分意味着文档的一个命名子单元,其标题要么恰好是 XYZ,要么包含 XYZ,后跟括号内的文本,该文本将 XYZ 翻译成另一种语言。(此处 XYZ 代表以下提到的特定部分名称,例如“致谢”、“献词”、“认可”或“历史”。)在修改文档时“保留该部分的标题”意味着根据此定义,它仍然是一个“标题为 XYZ”的部分。

文档可能包括与声明本许可证适用于文档的通知相邻的保证放弃声明。这些保证放弃声明被视为通过参考包含在本许可证中,但仅限于放弃保证:这些保证放弃声明可能具有的任何其他含义都是无效的,并且不影响本许可证的含义。

2. 完整复制

你可以在任何媒介中复制和分发文档,无论是商业性还是非商业性,只要本许可证、版权声明和声明本许可证适用于文档的通知在所有副本中复制,并且你不对本许可证的条件添加任何其他条件。你不得使用技术措施来阻止或控制你制作的或分发的副本的阅读或进一步复制。然而,你可以接受以副本为交换的报酬。如果你分发足够多的副本,你必须也遵守第三部分的条件。

你也可以在上述相同条件下借出副本,并且你可以公开展示副本。

3. 大量复制

如果您出版或分发超过 100 份的文档印刷副本(或通常有印刷封面的媒体副本),并且文档的许可通知要求封面文本,您必须将副本封装在带有以下所有封面文本的封面上,这些文本清晰易读:封面文本在封面,背面文本在背面。两个封面都必须清晰易读地识别您为这些副本的出版商。封面必须展示完整的标题,标题中的所有单词都应同等突出和可见。您还可以在封面上添加其他材料。只要它们保留了文档的标题并满足这些条件,对封面进行更改的复制可以被视为在其他方面逐字复制。

如果封面所需的文本太多,无法清晰显示,您应将列出的第一个(合理数量的)文本放在实际封面上,并将剩余的文本继续放在相邻页面上。

如果您出版或分发超过 100 份的文档不透明副本,您必须要么在每个不透明副本中包含一个机器可读的透明副本,要么在每个不透明副本中或与之一起声明一个计算机网络位置,使一般网络用户可以通过公共标准网络协议下载一个完整的透明副本,不包含任何额外材料。如果您选择后者,当您开始大量分发不透明副本时,您必须采取合理的谨慎措施,以确保该透明副本在至少一年内保持可访问,即从您最后一次向公众(直接或通过您的代理人或零售商)分发该版本的透明副本之后。

在重新分发大量副本之前,建议但不是必须联系文档的作者,以便给他们一个机会向您提供文档的更新版本。

4. 修改

您可以在上述第二部分和第三部分规定的条件下复制和分发文档的修改版本,前提是您必须将修改版本在完全相同的许可证下发布,使修改版本取代文档的角色,从而许可拥有该版本副本的人分发和修改修改版本。此外,您必须在修改版本中执行以下操作:

  • A. 在标题页(以及封面,如果有)中使用与文档及其先前版本不同的标题(如果有的话,应在文档的历史部分列出)。如果该版本的原始出版商允许,您可以使用与先前版本相同的标题。

  • B. 在标题页上列出作为作者的一个或多个个人或实体,他们负责修改版本的修改,以及至少五篇文档的主要作者(如果文档有五篇以下,则为所有主要作者),除非他们免除您此要求。

  • C. 在标题页上声明修改版本的出版商名称,作为出版商。

  • D. 保留文档的所有版权声明。

  • E. 在其他版权声明旁边添加适当的版权声明,以说明您的修改。

  • F. 在版权声明之后,立即包含一个许可声明,授予公众根据本许可的条款使用修改版本的权限,其形式如下所示在下面的附录中。

  • G. 在该许可声明中保留文档许可声明中给出的所有不变部分和必需的封面文本的完整列表。

  • H. 包含本许可的未更改副本。

  • I. 保留名为“历史”的部分,保留其标题,并在其中添加至少一项说明,包括修改版本的标题、年份、新作者和出版商,如标题页上所示。如果文档中没有名为“历史”的部分,创建一个包含文档的标题、年份、作者和出版商的说明,然后添加一项描述修改版本,如前句所述。

  • J. 保留文档中给出的网络位置,如果有的话,以便公众访问文档的透明副本,以及文档所基于的先前版本的相应网络位置。这些可以放在“历史”部分。对于在文档本身至少四年前出版的作品,或者如果该版本的原始出版商给予许可,您可以省略网络位置。

  • K. 对于任何名为“致谢”或“献词”的部分,保留该部分的标题,并在该部分中保留每个贡献者致谢和/或献词的所有实质内容和语气。

  • L. 保留文档的所有不变部分,其文本和标题不得更改。章节编号或等效内容不被视为章节标题的一部分。

  • M. 删除任何名为“推荐”的部分。此类部分不得包含在修改版本中。

  • N. 不要重命名任何现有部分为“推荐”或与任何不变部分在标题上冲突。

  • O. 保留任何保证放弃声明。

如果修改版本包含新的前言部分或附录,这些部分符合次要部分的标准且不包含从文档中复制的内容,您可以选择将这些部分中的一些或全部指定为不变部分。为此,将这些标题添加到修改版本许可声明中的不变部分列表中。这些标题必须与其他部分标题不同。

你可以添加一个名为“推荐”的章节,前提是它只包含对修改版的各种党派的推荐——例如,同行评审的声明或文本已被某个组织作为标准的权威定义所批准。

你可以在修改版的封面文本列表末尾添加最多五个字的段落作为封面文本,以及最多 25 字的段落作为背面文本。任何实体(或通过该实体安排)只能添加一个封面文本段落和一个背面文本段落。如果文档已经包含了由你或代表同一实体添加的相同封面文本,则你不能再添加另一个;但你可以在获得添加旧文本的前一出版者的明确许可后替换它。

文档的作者和出版者不通过本许可证授予使用他们的名字进行宣传、主张或暗示对任何修改版的认可或支持的许可。

5. 文档组合

你可以将文档与其他在此许可证下发布的文档组合,按照上述第四部分中定义的修改版条款进行,只要你包括所有原始文档的所有不变章节,未经修改,并在其许可证通知中将它们全部列为你的组合作品的不可变章节,并且你保留所有它们的保证放弃声明。

组合作品只需包含一个本许可证的副本,多个相同的不可变章节可以用一个副本替换。如果有多个具有相同名称但内容不同的不可变章节,可以通过在末尾添加括号中的原始作者或出版者的名字(如果已知)或一个唯一的数字来使每个此类章节的标题独特。对组合作品的许可证通知中不可变章节列表中的章节标题也进行相同的调整。

在组合中,你必须将各个原始文档中名为“历史”的章节合并成一个名为“历史”的章节;同样,合并任何名为“致谢”和任何名为“献词”的章节。你必须删除所有名为“推荐”的章节。

6. 文档集合

你可以制作一个由文档和其他在此许可证下发布的文档组成的集合,并替换各个文档中的单个许可证副本,用一个包含在集合中的单个副本来替换,只要你遵循本许可证关于逐字复制每份文档的规则,并在所有其他方面遵守。

你可以从这样的集合中提取单个文档,并在此许可证下单独分发,只要你将本许可证的副本插入到提取的文档中,并在所有其他方面遵守本许可证关于该文档逐字复制的规则。

7. 与独立作品的汇编

如果将文档或其衍生作品与其他独立且独立的文档或作品汇编在一起,在存储或分发介质的卷中,如果汇编产生的版权不用于限制汇编用户的法律权利,超出个别作品允许的范围,则称为“汇编”。当文档包含在汇编中时,本许可证不适用于汇编中的其他作品,除非这些作品本身是文档的衍生作品。

如果第三部分关于封面文本的要求适用于这些文档的副本,那么如果文档小于整个汇编的一半,文档的封面文本可以放置在包围文档的汇编封面或电子封面等效物上,如果文档是电子形式的话。否则,它们必须出现在包围整个汇编的打印封面上。

8. 翻译

翻译被视为一种修改,因此您可以在第四部分规定的条款下分发文档的翻译版本。用翻译替换不变部分需要从其版权所有者获得特别许可,但您可以在不变部分的原始版本之外包括某些或所有不变部分的翻译。您可以将本许可证的翻译版本以及文档中的所有许可证通知和任何保证放弃声明包括在内,前提是您还必须包括本许可证的原始英文版本以及那些通知和放弃声明的原始版本。如果翻译版本与本许可证的原始版本或通知或放弃声明之间存在不一致,则原始版本将占先。

如果文档中的某个部分标题为“致谢”、“献词”或“历史”,则保留其标题(第一部分)的要求(第四部分)通常需要更改实际标题。

9. 终止

您不得复制、修改、再许可或分发文档,除非本许可证明确提供。任何其他复制、修改、再许可或分发的行为都是无效的,并且将自动终止您根据本许可证的权利。

然而,如果您停止所有违反本许可证的行为,那么您从特定版权所有者那里获得的许可证将恢复(a)临时性地,除非和直到版权所有者明确且最终终止您的许可证,以及(b)永久性地,如果版权所有者在停止后的 60 天内未能通过某种合理方式通知您违反了许可证。

此外,如果版权所有者通过某种合理方式通知您违反了许可证,这是您第一次从该版权所有者那里收到关于违反本许可证的通知(针对任何作品),并且您在收到通知后的 30 天内纠正了违规行为,那么您从特定版权所有者那里获得的许可证将永久性地恢复。

本节下您权利的终止并不终止根据本许可证从您那里获得副本或权利的各方许可证。如果您的权利已被终止且未永久恢复,收到某些或全部相同材料的副本并不赋予您使用它的任何权利。

10. 本许可证的未来修订

Free Software Foundation 可能会不时发布新的、修订版的 GNU 自由文档许可证。这些新版本的精神将与当前版本相似,但在细节上可能有所不同,以解决新的问题或关注点。请参阅 http://www.gnu.org/copyleft/

每个许可证版本都有一个区分性的版本号。如果文档指定本许可证的特定编号版本“或任何后续版本”适用于它,您可以选择遵循该指定版本或任何已发布的后续版本(不是草案)的条款和条件。如果文档未指定本许可证的版本号,您可以选择 Free Software Foundation 已发布的任何版本(不是草案)。如果文档指定代理可以决定可以使用哪些未来版本的许可证,该代理对版本的公开接受声明永久授权您为该文档选择该版本。

11. 许可证更新

"大规模多作者协作网站"(或“MMC 网站”)指的是任何发布受版权保护的作品并提供显著设施供任何人编辑这些作品的万维网服务器。任何任何人都可以编辑的公共维基就是一个这样的服务器示例。网站中包含的“大规模多作者协作”(或“MMC”)指的是在 MMC 网站上因此发布的任何一组受版权保护的作品。

"CC-BY-SA" 指的是 Creative Commons Attribution-Share Alike 3.0 许可证,由总部位于加利福尼亚州旧金山的非营利性组织 Creative Commons Corporation 发布,以及该组织发布的该许可证的未来 copyleft 版本。

"合并"意味着将文档作为另一文档的一部分,全部或部分地发布或重新发布。

如果 MMC 在此许可证下获得许可,并且所有最初在其他地方(而非此 MMC)根据此许可证发布,随后全部或部分合并到 MMC 中的作品(1)没有封面文本或不变部分,并且(2)因此在此之前于 2008 年 11 月 1 日之前合并,则 MMC 是“有资格进行许可证更新的”。

MMC 网站的运营商可以在 2009 年 8 月 1 日之前,在任何时候将网站中的 MMC 在同一网站上以 CC-BY-SA 许可证重新发布,前提是 MMC 有资格进行许可证更新。

如何使用此许可证为您的文档

要在您所写的文档中使用此许可证,请在文档中包含许可证副本,并在标题页之后放置以下版权和许可证声明:

版权(c)YEAR YOUR NAME.

允许复制、分发和/或修改此文档

根据 GNU 自由文档许可协议第 1.3 版的条款。

或者任何由自由软件基金会发布的后续版本;

没有不变节,没有封面文字,也没有封底文字。

许可证副本包含在名为“GNU”的部分中。

自由文档许可协议"。

如果你有不带封面文字的不变节、封面文字和封底文字,将“with...Texts.”行替换为以下内容:

其中不变节为 LIST THEIR TITLES,与

封面文字为 LIST,封底文字为 LIST。

如果你有不带封面文字的不变节,或者三种组合中的任何一种,合并这两种选择以适应情况。

如果你的文档包含非平凡的程序代码示例,我们建议你选择自由软件许可证(如 GNU 通用公共许可证)并行发布这些示例,以允许在自由软件中使用。

附录 E. 更新

访问 nostarch.com/audacity.htm 获取勘误表、更新和其他信息。

posted @ 2025-11-25 17:05  绝不原创的飞龙  阅读(83)  评论(0)    收藏  举报