甄大美丽 - 博客园

公告

2021年6月1日

摘要： 1.什么是汉明窗? 语音信号一般在10ms到30ms之间，我们可以把它看成是平稳的。为了处理语音信号，我们要对语音信号进行加窗，也就是一次仅处理窗中的数据。因为实际的语音信号是很长的，我们不能也不必对非常长的数据进行一次性处理。明智的解决办法就是每次取一段数据，进行分析，然后再取下一段数据，再进行分阅读全文

posted @ 2021-06-01 10:28 甄大美丽阅读(1237) 评论(0) 推荐(1)

2021年5月31日

语音处理的分帧，帧移，加窗

摘要：一、分帧语音数据和视频数据不同，本没有帧的概念，但是为了传输与存储，我们采集的音频数据都是一段一段的。为了程序能够进行批量处理，会根据指定的长度（时间段或者采样数）进行分段，结构化为我们编程的数据结构，这就是分帧。语音信号在宏观上是不平稳的，在微观上是平稳的，具有短时平稳性（10 30ms内可以认阅读全文

posted @ 2021-05-31 09:58 甄大美丽阅读(2611) 评论(0) 推荐(0)