[发明专利]混淆矩阵的生成方法、装置、设备及存储介质在审

专利信息
申请号: 202210136362.8 申请日: 2022-02-15
公开(公告)号: CN114664287A 公开(公告)日: 2022-06-24
发明(设计)人: 肖艳红;赵茂祥;李全忠;何国涛;蒲瑶 申请(专利权)人: 普强时代(珠海横琴)信息技术有限公司
主分类号: G10L15/01 分类号: G10L15/01;G10L25/51
代理公司: 广州嘉权专利商标事务所有限公司 44205 代理人: 张芬
地址: 519000 广东省珠海市横琴新*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 混淆 矩阵 生成 方法 装置 设备 存储 介质
【说明书】:

发明提供一种混淆矩阵的生成方法、装置、设备及存储介质,该方法包括:将音频数据输入声学模型,得到每一帧的声学得分列表声学得分列表中包括至少一个声学得分,声学得分表征发音单元的声学后验概率;获取音频数据的每一帧的中心元素,根据声学得分列表更新中心元素在混淆矩阵对应的行;混淆矩阵中每一行表征中心元素与所有的发音单元的混淆度;混淆矩阵按行进行归一化,得到作为输出结果的混淆矩阵。本发明能够更好地量化发音之间的相似度,有效地提高混淆矩阵的生成效率和精确程度,防止错漏。

技术领域

本发明涉及语音识别技术领域,尤其涉及一种混淆矩阵的生成方法、装置、设备及存储介质。

背景技术

现如今随着人工智能的发展,语音识别的性能虽然有了很大提升,但是在实际应用中也会遇到一些识别错误,特别是一些易混淆的音,如l和n,s和sh,比如“年级”识别成“联机”,“九十”识别中“旧时”等。在某些特定的场景比如搜索音乐、给通讯录中的某个人打电话或者搜索某个地名等,可以上传用户个性化信息,比如用户的通讯录,将通讯录转换为发音单元集比如拼音集,然后把识别结果也转换为拼音,然后在目标拼音集中通过发音的相似程度进行匹配,最终获得混淆匹配的结果,以此提高识别性能。

进行混淆匹配关键是要有能够衡量不同发音相似程度的方法,现有的衡量发音相似度的方法一般是通过经验进行枚举。以汉语为例,比如b和p的发音比着b和y的发音更易混淆,ān和āng比ān和ōu更易混淆,因而一般地可以通过枚举的方式定义一些易混淆的发音。这种按照经验定义容易漏掉一些混淆音,并且不能很好的量化发音之间的相似程度。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明实施例提出一种混淆矩阵的生成方法、装置、设备及存储介质,以更好地量化发音之间的相似度。

一方面,本发明实施例提供一种混淆矩阵的生成方法,包括:将音频数据输入声学模型,得到每一帧的声学得分列表,所述声学得分列表中包括至少一个声学得分,所述声学得分表征发音单元的声学后验概率;获取所述音频数据的每一帧的中心元素,根据所述声学得分列表更新所述中心元素在混淆矩阵对应的行;所述混淆矩阵中每一行表征所述中心元素与所有的所述发音单元的混淆度;对所述混淆矩阵按行进行归一化,得到作为输出结果的所述混淆矩阵。

根据本发明的一些实施例,所述获取所述音频数据的每一帧的中心元素,包括:接收所述音频数据对应的对齐文件;从所述对齐文件中提取所述音频数据的每一帧的中心元素。

根据本发明的一些实施例,所述根据所述声学得分列表更新所述中心元素在混淆矩阵对应的行,包括:获取所述中心元素在混淆矩阵对应的行,作为第一行;确定所述声学得分列表中每个所述声学得分对应的所述发音单元,获取所述发音单元在所述混淆矩阵的所述第一行中对应的列作为第一列;根据所述声学得分对所述混淆矩阵的所述第一行的所述第一列的元素进行更新。

根据本发明的一些实施例,所述根据所述声学得分对所述混淆矩阵的所述第一行的所述第一列的元素进行更新,包括:所述混淆矩阵的所述第一行的所述第一列的元素累加所述声学得分。

根据本发明的一些实施例,所述对所述混淆矩阵按行进行归一化,得到作为输出结果的所述混淆矩阵,包括:对所述混淆矩阵的每一行进行求和,得到第一总和;将所述混淆矩阵中的每一行中的每一个元素,除以所述第一总和,得到归一化后的所述混淆矩阵作为所述输出结果。

根据本发明的一些实施例,所述方法包括:若归一化后的所述混淆矩阵中的任意元素小于第一阈值,则将所述任意元素配置为0。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普强时代(珠海横琴)信息技术有限公司,未经普强时代(珠海横琴)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210136362.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top