[发明专利]一种在线的端到端自动语音识别方法在审
申请号: | 202111531205.9 | 申请日: | 2021-12-15 |
公开(公告)号: | CN114255744A | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 宋虎;王建华;高明;尹青山 | 申请(专利权)人: | 山东新一代信息产业技术研究院有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 陈婷婷 |
地址: | 250100 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种在线的端到端自动语音识别方法,属于语音识别技术领域,用联合CTC/注意力结构,并使用基于块的注意力机制,使编码器流式地工作,以及动态块技术来获得不定长的未来上下文信息;该方法的实现包括:首先提取音频序列的FBank特征并基于动态块技术对序列进行分块,使用基于conformer的编码器获得基于块的注意力,对序列块进行编码;然后,CTC解码器将编码器的输出作为输入,使用前缀波束搜索进行第一路的解码,获得数个候选;AED解码器将CTC的候选输出进行重新评分,进行第二路的解码,以获得最终推理结果。本发明能够保证精度和低延迟的条件下,将端到端模型产品化并部署到端侧。 | ||
搜索关键词: | 一种 在线 端到端 自动 语音 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东新一代信息产业技术研究院有限公司,未经山东新一代信息产业技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111531205.9/,转载请声明来源钻瓜专利网。
- 上一篇:显示屏及其制造方法、显示装置及车辆
- 下一篇:压控振荡器及其锁相环