Alango - Speech Recognition Enhancement

2020-04-27 19:41:31 浏览数 (1)

穿戴和听力设备(wearable and hearable)设备需要永远在线(Always-on),这对于用户来说非常重要。我们不难想象出其重要性,比如外科医生(surgeon)在外科手术时佩戴智能眼镜,或者是建筑师在勘察施工现场的时候与电气工程师交流等等,所有这些用户场景都需要经过Alango 语音识别增强的(Speech Recognition Enhancement)自动语音识别技术。

这些看起来相当新奇的玩意(novelty)都会成为未来的关键(mission critical in the future)。

Alango持续提升其VEP(Voice Enhancement Package),即语音增强软件包的性能,服务于未来的关键性的的语音交互任务。

Alango VEP采用多麦克风Beam Forming方案(n-MIC),灵活适应客户的产品设计和用户场景(user case scenario),提供最优化的语音拾取性能(optimized voice pick-up)。

以上框图为Alango解决方案示意 -

N-Mic Beam Forming波束成形 - 通过定制化的麦克风阵列,采用波束成形技术,在背景噪音环境中(ambient noise)辨别语音命令的的方向并提取语音。具体设计与用户的工业设计和用户场景相关。

AEC(Acoustic EchoCanceller) 回声消除 - 单声道或立体声道的回声消除,保障外放音乐的情况下的双瞳语音通信(duplex communication)。

NS(Noise Suppression)噪音抑制 - 识别并抑制静态的和短暂的噪声(stationary and transcient noise)。

通过前端多麦克风阵列,噪音消除和回声消除技术,最优化声音提取(optimal voice pick up)至语音识别(ASR)引擎(如Sensory TrulyHandsFree ASR)识别。此方案根据客户需求高度可定制,且具有非常好的低功耗特性。

0 人点赞