声音场景(Acoustic scene)技术

2020-01-15 18:02:18 浏览数 (1)

内容感知(context-sensing)技术可以识别声音环境(acoustic surroundings),使智能手机和TWS等耳机产品可以识别并自适应动态的声音环境,会带来很多极具创新的应用价值。

声音场景技术可以识别本地的音场空间(soundscape),自适应动态调整降噪等功能,从而使你的虚拟助理可以在任何场景下识别并反映需求。

比如在机场,或者在通勤中,当你经过不同的场景时,如从嘈杂的生动环境,到安静的环境下,你的耳机可以智能的调整噪音消除,声音通透率,或者是频响均衡设置(equalization settings),以及其他最优的基于场景信息的动态调整。

声音场景(acoustic scenes)可以按照复杂度,功能可见性(affordances),以及声音特征(acoustic characteristics)等划分。

复杂性用于描述声音的嘈杂和安静程度,功能可见性用于描述声音的生动或阴郁程度等,形成不同的组合,比如 -

Chaotic/lively - 有可能是在嘈杂的酒吧或机场

Chaotic/sombre - 有可能是在地铁,火车,或汽车中,或者是在城市嘈杂的街道

Calm/lively - 有可能是在开放空间,如停车场

Calm/sombre - 有可能是在家庭或会议室环境中

以下视频可以看到是如何采集典型的声音事件数据的,如狗叫或打碎玻璃。

0 人点赞