Chapter 1 音乐表示

这一章主要介绍目前常用的音乐表示方法，包括乐谱(sheet music representations)、符号化表示法(symbolic representations)和音频(audio representations)。

乐谱

　　这一节中简单介绍了五线谱、节奏、十二平均律等基础音乐知识，没有什么值得着重关注的地方。

符号化表示法

符号化表示法的前身是自动钢琴的打孔纸卷：在纸卷上记录下各个音的开始位置和结束位置，之间挖出孔，机器可以直接读出相应的音并作出响应。以此诞生了一种符号化表示方法——piano roll representations，这种方式可以直观地表现出音的高低，与抽象的机器不可读的五线谱相比，这种方法可以更容易被机器阅读，因此也被看做一种“中级表示”。

　　在此基础上，MIDI（musical instrument digital interface）表示法被发明了（MIDI发明的目的并不是表示音乐，而是以数字方式记录下乐器的演奏信息，最后在合成器中产生相应的音），MIDI将音离散化（可以和钢琴的琴键一一对应），不同的整数对应不同的音。一个典型的MIDI记录了：动作（琴键按下或释放）、通道（可对应乐器编号）、时间（相对于开始时刻的脉冲周期数）、音符、力度等信息。依照这些MIDI记录，可以方便地转换成piano roll。

　　MIDI可以方便地被机器读取，但是，现在我们的软件可以直接显示乐谱并方便地进行试听和编辑（比如我用的guitar tab），得益于一种名为MusicXML的表示方法，同典型的XML一样，musicXML结构化地记录下了音乐的信息，如图所示：

根据这些信息，相应的软件可以渲染出五线谱供人阅读，也可以以此生成音乐试听。

小结：符号化表示法，特别是musicXML是计算机处理音乐的理想形式。

音频

　　这是我们最常见最直观的音乐表示方法，毕竟我们是靠耳朵听音乐的。这一节首先简单介绍了声音产生和传播的原理，这种初中物理知识我就不多赘述了。这里给出了计算音所对应的频率的公式（以A4为440hz）

　　另外还简单介绍了泛音列。

　　接着介绍音的一个特征的三个不同方面：动态（演奏时的“感情”）、强度、响度（强度和响度所站的视角不同，强度是以物理上单位面积的声音能量来定义的，而响度是人的主观感受）。

　　动态在乐谱中用强弱符号表示，这个没有什么好说的。

　　声音强度以W/m²为单位，为了方便理解，我们规定刚刚引起听觉的强度定义为TOH(thresholud of hearing)，0dB（数值上为10^-12 W/m^2），dB是一个指数增长的单位，用以表示两个值之间的商，当用来度量声音强度时，用相应的能量密度值除以TOH，取以10为底的对数，再乘以10。因此可以知道，当强度增大一倍时，dB线性增大大约3。

　　然而人的耳朵不是以上面强度的物理定义来感受音乐的强弱的，在主观看来，音乐的响度除了受到强度影响外，还与音持续的时间和音的频率有关：在这里我们考虑音的频率对响度的影响，以1khz为标准，将听到的不同x dB的声音响度定义为x phon（phon为响度单位），这时我们改变频率，记录下相同的响度所对应的dB为多少，依次可以得到一个与频率相关的等响度曲线，如下图

　　接下来是重中之重——音色，这里介绍了两种考察音色的视角，一种是对声音信号的包络线分析，一种是对泛音列（或者频率成分）分析。

　　一般来讲，乐器发出一股单音的过程包括四大阶段，包括attack,decay,sustain,release，简称ADSR，A阶段是声音产生的阶段，这一阶段会产生各种频率成分，增幅快速变大；D阶段时，除了泛音列中的频率能在乐器上形成稳定的驻波，其他频率成分的能量被耗散掉，增幅下降；S阶段，驻波持续在发声物体上震动，增幅基本保持稳定；R阶段，人为止音，或者驻波能量耗散殆尽。如下图所示：

　　这种模型与钢琴的包络面较为匹配，但小提琴的包络面则有与之不符合的地方，小提琴的A阶段持续时间较长，没有D阶段，当小提琴加入揉弦技巧时，S阶段会产生周期性的震荡（原因很显然。）因此，我们可以以此为根据，从不同乐器的不同ADSR特征入手，从时域信号视角来区别不同的音色，以区别不同乐器。

　　当然，最被看好的音色分析方法是泛音列（频率分析），可以从乐器频谱图中发现其独特的特征，例如：弦乐器的泛音更丰富，很多能量会存在于比较高的泛音中；管乐中的闭管乐器，其泛音列中不存在偶数泛音，只有奇数泛音；巴松管的基频含的能量比其泛音要少；音叉的大多数能量都存在于其基频中，这使它的音色十分像合成器发出的正弦波；钟的频谱很复杂，有许多非泛音成分，这使得它听起来就像没调好音一样。另外，弦乐器，包括钢琴，当弦越软的时候，其高频泛音部分就会越远离理论上的泛音频率，这也是它们关键性的音色特征。

　　音色是由多种因素影响，并且难以测量，这既给音乐带来了多样的风味，也给量化分析带来了巨大的困难。

小结：目前常用的音色分析都是基于频谱图的，当然ADSR特征也可以作为一个参考方面，可是当面对多声部同时演奏时，频谱图仍然能起作用，而ADSR显然已经淹没在音符的汪洋中了。因此可以预见，将来研究的主要工具还是频谱图。目前业界公认常数Q变换是最贴近人耳听觉习惯的频域分析方法，也基本是音乐计算不可缺少的处理步骤。

posted @ 2021-03-05 17:04 sajuuk 阅读(432) 评论(0) 收藏举报

刷新页面返回顶部

sajuuk

总·装·逼·部

Chapter 1 音乐表示

乐谱

符号化表示法

音频

公告