论文推荐
“ 《SFFAI 78期-语音识别专题》来自中科院自动化研究所的田正坤同学推荐的文章主要关注于语音识别领域,你可以认真阅读讲者推荐的论文,来与讲者及同行线上交流哦。”
关注文章公众号
回复"SFFAI78"获取本主题精选论文
01
推荐理由:本文介绍单调注意力机制,通过限制注意力机制的单调性,实现了语音识别的流式解码。
—— 田正坤
02
推荐理由:本文的思路与百度SMLTA相似,利用CTC的尖峰对编码序列进行切分,在切分块上计算注意力机制来实现流式解码。
—— 田正坤
03
推荐理由:本文是信息累积的思路。通过判断是否达到触发的阈值,如果达到阈值则在当前位置进行切分,如果没有达到阈值,则记录当前位置所包含的信息量,然后跳转到下一时刻并重复上述计算。
—— 田正坤
04
推荐理由:本文通过逐块解码的方式来实现流式解码,将编码序列切分为等长的块,在块内进行注意力的计算,如果预测得到空格标记则表示当前块解码完成,并跳转到下一个块,重复上述计算直到最后一个块解码结束。
—— 田正坤
05
推荐理由:本文最先将非递归网络引入语音识别任务,并提出了使用两种非递归网络的解码思路。
—— 田正坤
06
推荐理由:本文将CTC模型引入非递归网络的计算中,使用CTC的尖峰来预测目标序列的长度,并辅助模型收敛。
—— 田正坤