[发明专利]自动语音识别装置及方法在审
申请号: | 201880073991.2 | 申请日: | 2018-11-06 |
公开(公告)号: | CN111357049A | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 黄铭振;池昌真 | 申请(专利权)人: | 语享路有限责任公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/06;G10L15/14 |
代理公司: | 上海翼胜专利商标事务所(普通合伙) 31218 | 代理人: | 翟羽 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 语音 识别 装置 方法 | ||
1.一种自动语音识别装置,其中,包括用于存储将通过接口模块接收的语音数据转换并输出为记录数据的程序的存储器以及用于执行存储在所述存储器中的程序的处理器,当所述处理器执行所述程序时,基于预训练的第一模型将接收到的所述语音数据转换为发音代码数据,且基于预训练的第二模型将转换后的所述发音代码数据转换为记录数据。
2.根据权利要求1所述的自动语音识别装置,其中,预训练的所述第一模型是语音发音代码转换模型,且基于由所述语音数据和发音代码数据组成的并行数据来学习所述语音发音代码转换模型。
3.根据权利要求2所述的自动语音识别装置,其中,转换后的所述发音代码数据由以一维结构表示的长度为1以上的音素或特征值字母串组成。
4.根据权利要求2所述的自动语音识别装置,其中,转换后的所述发音代码数据由与语言无关的值组成。
5.根据权利要求1所述的自动语音识别装置,其中,预先训练的所述第二模型是发音代码记录转换模型,基于由所述发音代码数据和记录数据组成的并行数据来学习所述发音代码记录转换模型。
6.根据权利要求1所述的自动语音识别装置,其中,预先训练的所述第二模型是发音代码记录转换模型,所述第二模型一次将序列型发音代码转换为序列型记录。
7.根据权利要求1所述的自动语音识别装置,其中,预先训练的所述第一模型是语音发音代码转换模型,并且通过基于预先准备的语音数据无监督学习来生成所述语音发音代码转换模型。
8.根据权利要求7所述的自动语音识别装置,其中,预先准备的所述语音数据由并行数据和记录数据组成。
9.根据权利要求8所述的自动语音识别装置,其中,预训练的所述第二模型是发音代码记录转换模型,并且所述处理器基于预训练的所述语音发音代码转换模型转换发音代码数据以对应于所述并行数据中包括的语音数据,基于由所述处理器将被转换为与所述语音数据相对应的发音代码数据和所述记录数据组成的并行数据来训练预训练的所述发音代码记录转换模型。
10.根据权利要求2或7所述的自动语音识别装置,其中,所述处理器使用预先准备的音节发音数据从转换后的所述发音代码数据中生成字母候选序列,基于语料数据学习的语言模型的所述第二模型将生成的所述字母候选序列转换为所述记录数据。
11.一种自动语音识别方法,其中,包括:
接收语音数据的步骤;
根据预先学习的第一模型将接收到的所述语音数据转换为发音代码序列的步骤;以及
基于预训练的第二模型将转换后的所述发音代码字母串转换为记录数据的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语享路有限责任公司,未经语享路有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880073991.2/1.html,转载请声明来源钻瓜专利网。