内容感知(context-sensing)技术可以识别声音环境(acoustic surroundings),使智能手机和TWS等耳机产品可以识别并自适应动态的声音环境,会带来很多极具创新的应用价值。
声音场景技术可以识别本地的音场空间(soundscape),自适应动态调整降噪等功能,从而使你的虚拟助理可以在任何场景下识别并反映需求。
比如在机场,或者在通勤中,当你经过不同的场景时,如从嘈杂的生动环境,到安静的环境下,你的耳机可以智能的调整噪音消除,声音通透率,或者是频响均衡设置(equalization settings),以及其他最优的基于场景信息的动态调整。
声音场景(acoustic scenes)可以按照复杂度,功能可见性(affordances),以及声音特征(acoustic characteristics)等划分。
复杂性用于描述声音的嘈杂和安静程度,功能可见性用于描述声音的生动或阴郁程度等,形成不同的组合,比如 -
Chaotic/lively - 有可能是在嘈杂的酒吧或机场
Chaotic/sombre - 有可能是在地铁,火车,或汽车中,或者是在城市嘈杂的街道
Calm/lively - 有可能是在开放空间,如停车场
Calm/sombre - 有可能是在家庭或会议室环境中
以下视频可以看到是如何采集典型的声音事件数据的,如狗叫或打碎玻璃。