数字信号处理上课随笔1

FFT

$基2-FFT算法

$分裂基算法 ps.基-2FFT是分裂基的一个特殊情况

  • 【例】清华大学的一个专利提到了3780点DFT,按照常见思维,首先会选择补零至4096个点,并进行基2-FFT,但其实工程中要尽量减少计算量,缩短时间,清华大学采取了分裂基的方法。
    数字信息传输方法及其地面数字多媒体电视广播系统——清华大学专利 2003年
    “DFT块首先在频域形成,然后在射频调制前变换到时域。离散傅立叶变换可采用逆快速傅立叶变换(IFFT)程序实现。为分解FFT过程,非素数3744可分解为7×5×3^3 ×2^2 。时域DFT块由3780个取样表示,这些取样也叫做奈奎斯特取样,这是为恢复复频域子载波所需的最小取样数。”
    专利链接

数字语音处理

  1. IBM的viavoice
    他的第四代版本发布于1998年,用到了隐马尔可夫模型(Hidden Markov Model HMM)的方法,最高可以达到90%的准确率,搜索一看,原来在深度学习没有出现的时候,语音信号处理都是采用的 HMM,课题相关-语音转文字!
    一些文献:
    [1] A real-time prototype for small-vocabulary audio-visual ASR
    [2] HIERARCHICAL DISCRIMINANT FEATURES FOR AUDIO-VISUAL LVCSR
  2. 降噪耳机与自适应信号处理
    ···降噪耳机外面都有一个麦克风,可以采集外在环境的声音(称为噪声),采集过来,通过滤波器,次级路径产生的声波将与来自主路径的噪声发生相消干涉,噪声成分将得到有效衰减(与幅度也有关系),也需要考虑人耳的可听频带范围,这样就可以实现降噪。但随着设备的老化,或者长真菌,系统特性将发生变化,系统的噪声衰减性能将下降。因此,需要一种自适应算法随着系统变化自动调整滤波器系数。了解主动降噪系统——降噪耳机背后的技术
    ···自适应噪声消除(Adaptive noise cancelling)维基百科
    自适应噪声消除是一种信号处理技术,在某些常见情况下,当干扰已知、可接触但无法避免,且目标信号与干扰不相关(即不相关)时,该技术可高效抑制主传感器或主要传感器接收目标信号的附加干扰或噪声{此类情况的示例包括:麦克风试图接收机器附近或其他噪声源(如飞机驾驶舱)的语音;拖曳声纳阵列的海军舰艇,其自身的噪声会掩盖更弱的检测到的目标信号;获取胎儿心电图 (ECG),其中母亲更强的心电图的存在代表着不可避免的干扰}
    自适应噪声消除技术起源于 20 世纪 60 和 70 年代在Bernard Widrow教授的领导下由斯坦福大学电气工程学院自适应系统实验室开展的自适应系统、自适应滤波和信号处理的开创性工作。自适应滤波器包含可调整的参数(称为权重),由迭代自适应算法控制,以产生所需的传递函数。
    这个概念还出现了-在从心脏移植心电图中提取残留起搏器信号-这不就和我的课题紧密联系了吗?!
    这种原始噪音消除器的第二个应用是处理心脏移植动物的心电图,当时斯坦福医学中心的心脏移植先驱团队由诺曼·沙姆韦博士领导。数据由尤金·董博士和沃尔特·B·坎农博士以心电图多轨磁带记录的形式提供。
    对于接受心脏移植的患者,心干中装有患者起搏器的部分(称为窦房结或 SA 结)仍保留在原位,并继续在脑和神经系统的控制下发力。通常,该起搏器通过触发房室结 (AV) 来控制心脏的跳动速率,从而控制心率以满足身体的需求。(见下图)。对于正常患者,这代表一个反馈回路,但对于接受移植的患者,残留 SA 结和植入的 AV 结之间的连接不会重新建立,残留起搏器和植入的心脏以不同的速率独立跳动。
    研究人员对心脏移植患者开环情况下残留起搏器的行为非常感兴趣,但研究起搏器的心电图(p 波)却非常困难,因为即使双极导管传感器(主传感器)通过靠近 SA 节点的颈静脉插入,起搏器发出的较弱信号也会被植入心脏发出的信号所淹没。(见下图中从上往下第三条轨迹)。下图显示了消除供体心脏对 p 波心电图影响的噪声消除装置。
    通过患者的肢体间心电图获得参考信号(见下图顶部轨迹),该信号提供了基本不受起搏器 p 波影响的供体心脏主心电图。自适应噪声消除用于将参考信号转换为主输入端存在的供体心脏信号的估计值(见从上往下第二条轨迹),并用于大幅降低供体心脏对主心电图的影响(第三条轨迹),从而在噪声消除器输出端提供基本干净的 p 波版本(见底部轨迹),适合进一步研究和分析。
  3. 耳蜗可以对声音进行傅里叶分析
    频谱信息主要编码在 ANF(听觉神经纤维auditory nerve fiber) 活动的空间分布中,因为耳蜗(cochlea)对复杂声音进行傅里叶分析,以向大脑发出频率成分的相对幅度信号。相反,时间信息通过纤维组内和纤维组之间尖峰的精确计时来传输。频谱处理与时间处理的重要性一直存在争议。在频谱处理中,声音频率由耳蜗的兴奋位置编码。在时间处理中,频率由响应周期性编码。两者似乎都很重要,因为听觉系统似乎采用频谱-时间处理,包括音调定位表征与时间分析相结合,以提取有关声学信号随时间变化的频谱信息。频谱处理对听觉编码的重要性反映在从外围到皮层的听觉通路的所有阶段都存在音调定位组织。人类耳蜗含有约 3,000 个 IHC(内毛细胞inner hair cells),代表着编码声音频谱的多个频率通道。相比之下,现代人工耳蜗包含约 10 个刺激电极。尽管语音清晰度取决于声音的频谱和时间特征,在困难的聆听环境中,频谱线索的重要性日益增加,但时间处理的重要性体现在人工耳蜗能够实现语音感知,尽管频谱分辨率相对较差。Encoding sound in the cochlea: from receptor potential to afferent discharge
    更一般地说,耳蜗中频率辨别的波性质被认为是一种有效的频谱分析形式(Mandal等人2009JSSC)。这些作者对耳蜗中使用的行波频率分析方法的效率进行了特别有趣的讨论,并与滤波器组和 FFT 算法进行了比较。The cochlea as a smart structure
posted @ 2025-01-09 23:02  沐雬  阅读(119)  评论(0)    收藏  举报