语音识别方法汇总与实例搭建

2021-01-14 14:37:56 浏览数 (1)

文章目录

  • 语音识别
  • 语音识别过程
    • 预处理:语音信号预处理—提取语音MFCC特征
    • 工具Kaldi
    • DeepSpeech
    • wav2letter
    • 端到端语音识别

语音识别

  • 自动语音识别技术(AUTOMATIC SPEECH RECOGNITION, ASR)是一种将人的语音转换为文本 的技术。语音识别作为一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处 理理论、信息论、计算机科学等众多学科紧密相连。
  • 语音识别近年来受关注度不断提升,相关技术广泛用于家用电器和电子设备,如智能音 箱、声控遥控器,移动应用上的各种声控操作、语音助手等;也可用于个人、呼叫中心, 以及电信级应用的信息查询与服务等领域。
  • 典型的语音识别系统由5部分构成:特征提取、声学模型、发音词典、语言模型和解码搜索。
    • 过程简介:
      • 

0 人点赞