MFC录制音频和播放音频

 

一、录制音频

  在windows中提供了相应的API函数(waveIn这个族的函数)实现录音功能;在使用这些函数时,一定要引入相应的头文件

#include <windows.h>

#include <Mmsystem.h>

#pragram comment(lib, "Winmm.lib")

1、在开始录音之前,需要首先定义音频的相关信息:使用WAVEFORMATEX结构,设置相关的音频流信息。以下是MSDN中的定义:

typedef struct 
{
WORD wFormatTag;        // 波形音频的格式,一般情况下设置为WAVE_FORMAT_PCM
WORD nChannels;         // 音频声道的数量。可以是1或者2(现在电脑基本上都是左右两个声道,因此一般设置为2)
DWORD nSamplesPerSec;   // 每个声道播放和接收的音频的样本频率(一般的频率为8khz, 11.025khz, 22.05khz,44.1khz)
DWORD nAvgBytesPerSec;  // 平均的数据传输率,单位为byte/s
WORD nBlockAlign;       // 以字节为单位的块对齐的大小,一般为:(nChannels * wBitsPerSample)/8
WORD wBitsPerSample;    // 根据wFormatTag设置的类型,设置采样率的大小,如果设置为WAVE_FORMAT_PCM,则大小为8的整倍数
WORD cbSize;            // 额外的空间,一般不需要,设置为0
}WAVEFORMATEX, *PWAVEFORMATEX;

定义一个WAVEFORMATEX对象,根据自己的要求设置音频流的信息,如下:

WAVEFORMATEX waveFormat;
waveFormat.nSamplesPerSec = 44100;
waveFormat.wBitsPerSample = 16;
waveFormat.nChannels = 2;
waveFormat.cbSize = 0;
waveFormat.wFormatTag = WAVE_FORMAT_PCM;
waveFormat.nBlockAlign = (waveFormat.wBitsPerSample * waveFormat.nChannels)/8;
waveFormat.nAvgBytesPerSec = waveFormat.nBlockAlign * waveFormat.nSamplesPersec;

2、当音频流信息设置完成后,接下来需要启动录音设备:使用waveInOpen函数。

waveInOpen函数原型为:

WINMMAPI
MMRESULT
WINAPI
waveInOpen(
    _Out_opt_ LPHWAVEIN phwi,    // 一个特定的录音设备指针,如果设备启动成功,该参数的值将会被赋值为启动的设备
    _In_ UINT uDeviceID,       // 需要启动的设备ID。一般不会手动指定某个设备,而是通过设置WAVE_MAPPER,通过系统查找可用设备
    _In_ LPCWAVEFORMATEX pwfx,     // 音频流信息对象的指针。这个参数就是我们第一步设置的对象
    _In_opt_ DWORD_PTR dwCallback,  // 录音消息的处理程序,可以设置一个函数、事件句柄、窗口句柄、一个特定的线程。也就是说录音消息产生后,由这个参数对应的值来处理该消息。包括关闭录音、缓冲区已满、开启设备
    _In_opt_ DWORD_PTR dwInstance,   // dwCallback参数的参数列表
    _In_ DWORD fdwOpen               // 打开设备的标识符。对应dwCallback,如果第四个参数设置为函数,则这个参数的值为CALLBACK_FUNCTION;如果为线程,则为CALLBACK_THREAD
    );

注意:要想该函数成功执行,必须在开始之前,有录音设备的存在(台式电脑一定要插入麦克风才可以被检测到)。

3、当录音设备启动后,接下来需要声明两个缓冲区和两个缓冲区头部结构体WAVEHDR对象,缓冲区用来存放录音音频,并用缓冲区初始化头部对象:

INT bufSize = 512;

BYTE *pBuffer1 = new BYTE[bufSize];
if (pBuffer1 == NULL) return;
memset(pBuffer1, 0, bufSize);

WAVEHDR wHdr1;
wHdr1.lpData = (LPSTR)pBuffer1;
wHdr1.dwBufferLength = bufSize;
wHdr1.dwBytesRecorded = 0;
wHdr1.dwUser = 0;
wHdr1.dwFlags = 0;
wHdr1.dwLoops = 1;

BYTE *pBuffer2 = new BYTE[bufSize];
if (pBuffer2 == NULL) return;
memset(pBuffer2,0, bufSize);

WAVEHDR wHdr2;
wHdr2.lpData = (LPSTR)pBuffer2;
wHdr2.dwBufferLength = bufSize;
wHdr2.dwBytesRecorded = 0;
wHdr2.dwUser = 0;
wHdr2.dwFlags = 0;
wHdr2.dwLoops = 1;

WAVEHDR对象定义如下:

typedef struct
{
LPSTR lpData;          // 缓冲区存放的内容
DWORD dwBufferLength;  // 缓冲区的大小
DWORD dwButesRecorded; // 缓冲区中存放的字节数
DWORD_PTR dwUser; 
DWORD dwFlags;
DWORD dwLoops;
struct wavehdr_tag *lpNext;
DWORD_PTR reserved;
} WAVEHDR;

4、接下来将这两个头部对象,加入到准备的录音缓冲区中。该过程使用waveInPrepareHeader函数。

waveInPrepareHeader(hWaveIn, &wHdr1, sizeof(WAVEHDR)); // 准备第一个波形数据块用于录音
waveInPrepareHeader(hWaveIn, &wHdr2, sizeof(WAVEHDR)); // 准备第二个数据块用于录音

 waveInPrepareHeader的第一个参数表示:录音设备句柄;第二个参数表示:录音的缓冲区对象;第三个参数表示:录音缓冲区结构体的大小。

5、当准备好录音缓冲区,就可以将录音缓冲区加入到指定的录音设备中。该步骤使用waveInAddBuffer函数:

waveInAddBuffer(hWaveIn, &wHdr1, sizeof(WAVEHDR)); // 指定波形数据块为录音输入缓存
waveInAddBuffer(hWaveIn, &wHdr2, sizeof(WAVEHDR)); // 指定波形数据块为录音缓存

分别将缓冲区1和2设置为录音缓冲区。这些缓冲区将被加入到录音缓冲队列中,缓冲区循环执行。

6、开始录音,使用waveInStart函数

waveInStart(hWaveIn); // 开始录音

这个函数的意思就是,通过hWaveIn录音设备,将波形音频放入录音缓冲区(前面已经指定了缓冲区)

7、当缓冲区满时,waveInStart函数,就会自动的调用waveInOpen函数中指定的函数/窗体/事件;通过该函数,用户可以将缓冲区的波形文件发给其它的用户,也可以将缓冲区的文件保存起来,即就是用户对缓冲区的拷贝。声卡自动将音频缓冲区从缓冲队列中删除。拷贝完成后,就将该缓冲区以及对应的音频头文件初始化,并通过waveInAddBuffer函数重新加入录音缓冲队列中。

DWORD CIP_PHONEDlg::MicCallBack(HWAVEIN hWaveIn, UINT uMsg, DWORD dwInstance, DWORD dwParam1, DWORD dwParam2)
{
    // 所有的这些录音缓冲区都是由录音函数自动触发的,开发这不需要自己触发
    CIP_PHONEDlg *pwnd = (CIP_PHONEDlg*)dwInstace;     // 表示录音的窗体
    PWAVEHDR whd = (PWAVEHDR)dwParam1; // 录音的头结构体对象
    switch(uMsg)
   {
    case WIM_OPEN: // 打开录音设备,这里不做处理
            break;
   case WIM_DATA: // 表示缓冲区已满,我们将信息写入一个pcm文件
         {
             // 保存数据
             pwnd->pf = fopen(pwnd->soundName, "ab+"); // 一定要以二进制数据写入,否则录音的音频会出现杂音
             Sleep(1000);  // 等待声音录制1s
             fwrite(whd->lpData, 1, whd->dwBufferLength, pwnd->pf);
             if (pwnd->isGetSound)
             {
                  waveInAddBuffer(hWaveIn, whd, sizeof(WAVEHDR));
              }
              fclose(pwnd->pf);
         }
         break;
    case WIM_CLOSE: // 停止录音
       {
           waveInStop(hWaveIn);
           waveInReset(hWaveIn);     
           waveInClose(hWaveIn);
        }
        break;
     default:
         break;
   } 
   return 0;
}

8、停止录音,使用waveInClose函数执行该操作

delete [] pBuffer1->lpData;
delete [] pBuffer2->lpData;
waveInClose(hWaveIn); // 停止录音

停止录音时,将会触发WIM_CLOSE消息。

在这个过程中首先执行waveInStop函数:表示禁止向输入缓冲区中输入波形数据;

然后执行waveInReset函数:表示停止波形数据的输入并且将当前的位置位0,将所有挂起的输入缓冲区设置为完成,并返回给应用程序(其实就是一个复位操作)

最后执行waveInClose函数:表示关闭录音设备。

 

 

  

 

posted @ 2017-02-21 17:37  木缥缈  阅读(3005)  评论(0编辑  收藏  举报