近来,通过将噪声消除技术和语音增强技术相结合,NEC开发了一种语音识别技术,该技术无需靠近智能手机或平板电脑即可在嘈杂的地方执行语音操作。
家用电器和便携式终端越来越多地采用语音操作功能,但是仍需要使内置麦克风靠近嘴才能清晰地发音。
因此,在诸如打开电视的房间,正在做饭的厨房以及正在移动的汽车之类的嘈杂环境中,存在终端不响应语音或对噪声做出反应以及故障的问题。
发生。
使用NEC的最新技术后,在难以使用语音功能的嘈杂环境中,即使在距麦克风一定距离处发出的语音也可以被正确检测,以实现终端的操作。
例如,放置在桌子上的终端可以在嘈杂的客厅中从大约1 m的位置操作。
这次开发的噪声消除技术和语音增强技术的概述如下。
(1)使用辅助麦克风检测噪声成分并准确跟踪噪声。
大多数便携式终端(例如智能手机)在正面配备了主麦克风,在背面或侧面配备了辅助麦克风。
NEC的技术专注于这种双麦克风设计。
当采用双麦克风设计时,很容易使主麦克风主要拾取语音输入,而辅助麦克风主要拾取噪声。
因此,当没有来自主麦克风的语音输入时(例如,语音输入即将开始等),可以从辅助麦克风收集声音。
可以明确噪声成分。
这样,即使主麦克风具有语音输入,也很容易准确地跟踪并消除噪音。
(2)使用语音模型将其调整为最适合语音识别的状态对于在去除噪声后失真且难以识别的语音,此次开发了一种基于该模型的增强语音成分的技术。
这项技术可以将失真的语音校正为类似波形的语音模型,从而使语音识别更加容易。
据报道,语音识别的准确性高于便携式终端语音识别的全球标准ETSI高级前端(AFE)。