麦可兴阵列麦克风硅麦原理
学术上有个概念是“传声器阵列”,主要由一定数目的声学传感器组成,用来对声场的空间特性进行采样并处理的系统。而这篇文章讲到的麦克风阵列是其中一个狭义概念,特指应用于语音处理的按一定规则排列的多个麦克风系统,也可以简单理解为2个以上麦克风组成的录音系统。
二、麦克风阵列需求
消费级麦克风阵列的兴起得益于语音交互的市场火热,主要解决远距离语音识别的问题,以保证真实场景下的语音识别率。这涉及了语音交互用户场景的变化,当用户从手机切换到类似Echo智能音箱或者机器人的时候,实际上麦克风面临的环境就完全变了,这就如同两个人窃窃私语和大声嘶喊的区别。
前几年,语音交互应用最为普遍的就是以Siri为代表的智能手机,这个场景一般都是采用单麦克风系统。单麦克风系统可以在低噪声、无混响、距离声源很近的情况下获得符合语音识别需求的声音信号。但是,若声源距离麦克风距离较远,并且真实环境存在大量的噪声、多径反射和混响,导致拾取信号的质量下降,这会严重影响语音识别率。而且,单麦克风接收的信号,是由多个声源和环境噪声叠加的,很难实现各个声源的分离。这样就无法实现声源定位和分离,这很重要,因为还有一类声音的叠加并非噪声,但是在语音识别中也要抑制,就是人声的干扰,语音识别显然不能同时识别两个以上的声音。
显然,当语音交互的场景过渡到以Echo、机器人或者汽车为主要场景的时候,单麦克风的局限就凸显出来。为了解决单麦克风的这些局限性,利用麦克风阵列进行语音处理的方法应时而生。麦克风阵列由一组按一定几何结构(常用线形、环形)摆放的麦克风组成,对采集的不同空间方向的声音信号进行空时处理,实现噪声抑制、混响去除、人声干扰抑制、声源测向、声源跟踪、阵列增益等功能,进而提高语音信号处理质量,以提高真实环境下的语音识别率。
三、麦克风关键技术
消费级的麦克风阵列主要面临环境噪声、房间混响、人声叠加、模型噪声、阵列结构等问题,若使用到语音识别场景,还要考虑针对语音识别的优化和匹配等问题。为了解决上述问题,特别是在消费领域的垂直场景应用环境中,关键技术就显得尤为重要。
噪声抑制:语音识别倒不需要完全去除噪声,相对来说通话系统中需要的技术则是噪声去除。这里说的噪声一般指环境噪声,比如空调噪声,这类噪声通常不具有空间指向性,能量也不是特别大,不会掩盖正常的语音,只是影响了语音的清晰度和可懂度。这种方法不适合强噪声环境下的处理,但是应付日常场景的语音交互足够了。
混响消除:混响在语音识别中是个蛮讨厌的因素,混响去除的效果很大程度影响了语音识别的效果。我们知道,当声源停止发声后,声波在房间内要经过多次反射和吸收,似乎若干个声波混合持续一段时间,这种现象叫做混响。混响会严重影响语音信号处理,比如互相关函数或者波束主瓣,降低测向精度。
回声抵消:严格来说,这里不应该叫回声,应该叫“自噪声”。回声是混响的延伸概念,这两者的区别就是回声的时延更长。一般来说,超过100毫秒时延的混响,人类能够明显区分出,似乎一个声音同时出现了两次,我们就叫做回声,比如天坛著名的回声壁。实际上,这里所指的是语音交互设备自己发出的声音,比如Echo音箱,当播放歌曲的时候若叫Alexa,这时候麦克风阵列实际上采集了正在播放的音乐和用户所叫的Alexa声音,显然语音识别无法识别这两类声音。回声抵消就是要去掉其中的音乐信息而只保留用户的人声,之所以叫回声抵消,只是延续大家的习惯而已,其实是不恰当的。
声源测向:这里没有用声源定位,测向和定位是不太一样的,而消费级麦克风阵列做到测向就可以了,没必要在这方面投入太多成本。声源测向的主要作用就是侦测到与之对话人类的声音以便后续的波束形成。声源测向可以基于能量方法,也可以基于谱估计,阵列也常用TDOA技术。声源测向一般在语音唤醒阶段实现,VAD技术其实就可以包含到这个范畴,也是未来功耗降低的关键研究内容。
波束形成:波束形成是通用的信号处理方法,这里是指将一定几何结构排列的麦克风阵列的各麦克风输出信号经过处理(例如加权、时延、求和等)形成空间指向性的方法。波束形成主要是抑制主瓣以外的声音干扰,这里也包括人声,比如几个人围绕Echo谈话的时候,Echo只会识别其中一个人的声音。
阵列增益:这个比较容易理解,主要是解决拾音距离的问题,若信号较小,语音识别同样不能保证,通过阵列处理可以适当加大语音信号的能量。
模型匹配:这个主要是和语音识别以及语义理解进行匹配,语音交互是一个完整的信号链,从麦克风阵列开始的语音流不可能割裂的存在,必然需要模型匹配在一起。实际上,效果较好的语音交互专用麦克风阵列,通常是两套算法,一套内嵌于硬件实时处理,另外一套服务于云端匹配语音处理。
四、青兴适合运用阵列硅麦的型号推荐---高灵敏度、高信噪比硅麦
QX-4737数字硅麦 -26DBFS SNR59 PDM输出
QX-3526数字硅麦 -26DBFS SNR65 PDM输出
QX-4030数字硅麦 -26DBFS SNR64 PDM输出
同类文章排行
- 电容式微麦克风结构原理
- 新品硅咪上市强烈推荐
- 硅麦相比与驻极体咪头有啥优势?双麦降噪原理
- 目前电子烟贴片式咪头怎么没有产品出现在市场
- 麦可兴阵列麦克风硅麦原理
- 青兴咪头降噪数字硅麦品牌logo图标更新公告
- 麦克风咪头6027有噪音怎么办?
- 青兴发布2023款老人专用助听器mems硅麦
- 麦克风咪头工厂青兴4015咪头高灵敏度参数是什么
- 9750单指向降噪阵列咪头功能阐述
最新资讯文章
- 如何用常规万用表检测麦克风咪头好坏?
- 喇叭Speaker扬声器增加音量的方法建议
- 青兴推出新品2024款耐低温零下40度咪头
- MIC电容咪头与动圈咪头的差役区别是
- 青兴新品电子烟信号咪头带防油防酸
- 深圳青兴伟业咪头厂家发布2024款消噪咪头
- 能寄送产品来贵司调试麦克风咪头或者动圈麦吗
- 动圈咪头输出阻抗是多少?
- 咪头线路板哪些地方能引起电流声
- 阵列麦克风咪头语音模块如何选型?
- 端子咪头使用过程中出频繁接触不良是什么原因
- 请问有电子烟反面吸气的咪头吗?
- 如何评判单指向降噪咪头的麦克风性能?
- 青兴咪头生产厂家发布新品降噪电竞耳机专用麦
- 深圳麦可兴发布新品6027降噪高灵敏度防插板浮高
- 智能头顶风扇(吊扇)如何选择咪头麦克风?
- 青兴研发2023最新款防油电子烟PCBA方案板
- 一次性烟弹咪头与换弹咪头有区别吗?
- 电容MIC咪头最怕什么干扰,会影响唤醒功能
- 深圳青兴伟业发布2023首款超薄体积2718数字降噪硅