如何实现麦克风采集与播放功能的?
摘要:如何采集麦克风输入的声音数据?又如何把声音数据通过扬声器播放出来?如何直接播放wav格式的声音文件了?这些功能使用C#也能轻松搞定。
在网络聊天系统中,采集麦克风的声音并将其播放出来,是最基础的模块之一。本文我们就介绍如何快速地实现这个基础模块。
一. 基础知识
有几个与声音采集和播放相关的专业术语必须要先了解一下,否则,后面的介绍将无法展开。语音采集指的是从麦克风采集音频数据,即声音样本转换成数字信号。其涉及到几个重要的参数:采样率、采样位数、声道数。
简单的来说:
采样率:即采样频率,就是在1秒内进行采集动作的次数。
采样位数:又叫采样深度,就是每次采集动作得到的数据长度,即使用多少个bit来记录一个样本。
声道数:一般是单声道或双声道(立体声)。普通的麦克风采集几乎都是单声道的。
这样,1秒钟采集得到的声音数据的大小为(单位byte):(采样频率×采样位数×声道数×时间)/8。
音频帧:通常一个音频帧的时长为10ms,即每10ms的数据构成一个音频帧。假设:采样率16k、采样位数16bit、声道数1,那么一个10ms的音频帧的大小为:(16000*16*1*0.01)/8 = 320 字节。计算式中的0.01为秒,即10ms
二. 如何采集、播放?
如果直接基于底层的DirectX来进行麦克风的采集与播放,那将是十分繁琐的。好在我们有现成的组件来完成这个工作,MCapture用于采集硬件设备(如麦克风、摄像头、声卡、屏幕等),MPlayer用于播放采集到的数据。
1.采集麦克风
MCapture提供了IMicrophoneCapturer,用于采集麦克风输入的声音。其每隔20ms触发一次AudioCaptured事件,通过事件的参数byte[]暴露这20ms采集得到的数据。
IMicrophoneCapturer相关采集参数的值是这样的:
采样频率:16000,采样位数:16bit,声道数:1。
所以,按照上面的公式进行计算,我们可以得到AudioCaptured事件的参数byte[]的长度为640。
2. 播放声音数据
MPlayer提供了IAudioPlayer,用于播放声音数据。在创建IAudioPlayer实例时,要正确的设置采样频率、采样位数、声道数这些参数的值,如果它们与即将要播放的声音数据的特征不一致,播放将出现错误。
我们在拿到MCapture采集的声音数据后,将其提交给IAudioPlayer的Play方法进行播放即可。
三.Demo实现
在有了前面的介绍作为基础后,接下来实现麦克风的采集和播放就相当简单了。在接下来的demo中,不仅演示了播放从麦克风采集到的声音,而且多加了一个功能,就是直接播放wav声音文件,这些实现都是相当简单的。
