文章目录
- 语音识别
- 语音识别过程
-
- 预处理:语音信号预处理—提取语音MFCC特征
- 工具Kaldi
- DeepSpeech
- wav2letter
- 端到端语音识别
语音识别
- 自动语音识别技术(AUTOMATIC SPEECH RECOGNITION, ASR)是一种将人的语音转换为文本 的技术。语音识别作为一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处 理理论、信息论、计算机科学等众多学科紧密相连。
- 语音识别近年来受关注度不断提升,相关技术广泛用于家用电器和电子设备,如智能音 箱、声控遥控器,移动应用上的各种声控操作、语音助手等;也可用于个人、呼叫中心, 以及电信级应用的信息查询与服务等领域。