[发明专利]自动语音识别装置及方法在审

专利信息
申请号: 201880073991.2 申请日: 2018-11-06
公开(公告)号: CN111357049A 公开(公告)日: 2020-06-30
发明(设计)人: 黄铭振;池昌真 申请(专利权)人: 语享路有限责任公司
主分类号: G10L15/26 分类号: G10L15/26;G10L15/06;G10L15/14
代理公司: 上海翼胜专利商标事务所(普通合伙) 31218 代理人: 翟羽
地址: 韩国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 自动 语音 识别 装置 方法
【权利要求书】:

1.一种自动语音识别装置,其中,包括用于存储将通过接口模块接收的语音数据转换并输出为记录数据的程序的存储器以及用于执行存储在所述存储器中的程序的处理器,当所述处理器执行所述程序时,基于预训练的第一模型将接收到的所述语音数据转换为发音代码数据,且基于预训练的第二模型将转换后的所述发音代码数据转换为记录数据。

2.根据权利要求1所述的自动语音识别装置,其中,预训练的所述第一模型是语音发音代码转换模型,且基于由所述语音数据和发音代码数据组成的并行数据来学习所述语音发音代码转换模型。

3.根据权利要求2所述的自动语音识别装置,其中,转换后的所述发音代码数据由以一维结构表示的长度为1以上的音素或特征值字母串组成。

4.根据权利要求2所述的自动语音识别装置,其中,转换后的所述发音代码数据由与语言无关的值组成。

5.根据权利要求1所述的自动语音识别装置,其中,预先训练的所述第二模型是发音代码记录转换模型,基于由所述发音代码数据和记录数据组成的并行数据来学习所述发音代码记录转换模型。

6.根据权利要求1所述的自动语音识别装置,其中,预先训练的所述第二模型是发音代码记录转换模型,所述第二模型一次将序列型发音代码转换为序列型记录。

7.根据权利要求1所述的自动语音识别装置,其中,预先训练的所述第一模型是语音发音代码转换模型,并且通过基于预先准备的语音数据无监督学习来生成所述语音发音代码转换模型。

8.根据权利要求7所述的自动语音识别装置,其中,预先准备的所述语音数据由并行数据和记录数据组成。

9.根据权利要求8所述的自动语音识别装置,其中,预训练的所述第二模型是发音代码记录转换模型,并且所述处理器基于预训练的所述语音发音代码转换模型转换发音代码数据以对应于所述并行数据中包括的语音数据,基于由所述处理器将被转换为与所述语音数据相对应的发音代码数据和所述记录数据组成的并行数据来训练预训练的所述发音代码记录转换模型。

10.根据权利要求2或7所述的自动语音识别装置,其中,所述处理器使用预先准备的音节发音数据从转换后的所述发音代码数据中生成字母候选序列,基于语料数据学习的语言模型的所述第二模型将生成的所述字母候选序列转换为所述记录数据。

11.一种自动语音识别方法,其中,包括:

接收语音数据的步骤;

根据预先学习的第一模型将接收到的所述语音数据转换为发音代码序列的步骤;以及

基于预训练的第二模型将转换后的所述发音代码字母串转换为记录数据的步骤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语享路有限责任公司,未经语享路有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201880073991.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top