[发明专利]混淆矩阵的生成方法、装置、设备及存储介质在审
| 申请号: | 202210136362.8 | 申请日: | 2022-02-15 |
| 公开(公告)号: | CN114664287A | 公开(公告)日: | 2022-06-24 |
| 发明(设计)人: | 肖艳红;赵茂祥;李全忠;何国涛;蒲瑶 | 申请(专利权)人: | 普强时代(珠海横琴)信息技术有限公司 |
| 主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L25/51 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 张芬 |
| 地址: | 519000 广东省珠海市横琴新*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 混淆 矩阵 生成 方法 装置 设备 存储 介质 | ||
本发明提供一种混淆矩阵的生成方法、装置、设备及存储介质,该方法包括:将音频数据输入声学模型,得到每一帧的声学得分列表声学得分列表中包括至少一个声学得分,声学得分表征发音单元的声学后验概率;获取音频数据的每一帧的中心元素,根据声学得分列表更新中心元素在混淆矩阵对应的行;混淆矩阵中每一行表征中心元素与所有的发音单元的混淆度;混淆矩阵按行进行归一化,得到作为输出结果的混淆矩阵。本发明能够更好地量化发音之间的相似度,有效地提高混淆矩阵的生成效率和精确程度,防止错漏。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种混淆矩阵的生成方法、装置、设备及存储介质。
背景技术
现如今随着人工智能的发展,语音识别的性能虽然有了很大提升,但是在实际应用中也会遇到一些识别错误,特别是一些易混淆的音,如l和n,s和sh,比如“年级”识别成“联机”,“九十”识别中“旧时”等。在某些特定的场景比如搜索音乐、给通讯录中的某个人打电话或者搜索某个地名等,可以上传用户个性化信息,比如用户的通讯录,将通讯录转换为发音单元集比如拼音集,然后把识别结果也转换为拼音,然后在目标拼音集中通过发音的相似程度进行匹配,最终获得混淆匹配的结果,以此提高识别性能。
进行混淆匹配关键是要有能够衡量不同发音相似程度的方法,现有的衡量发音相似度的方法一般是通过经验进行枚举。以汉语为例,比如b和p的发音比着b和y的发音更易混淆,ān和āng比ān和ōu更易混淆,因而一般地可以通过枚举的方式定义一些易混淆的发音。这种按照经验定义容易漏掉一些混淆音,并且不能很好的量化发音之间的相似程度。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明实施例提出一种混淆矩阵的生成方法、装置、设备及存储介质,以更好地量化发音之间的相似度。
一方面,本发明实施例提供一种混淆矩阵的生成方法,包括:将音频数据输入声学模型,得到每一帧的声学得分列表,所述声学得分列表中包括至少一个声学得分,所述声学得分表征发音单元的声学后验概率;获取所述音频数据的每一帧的中心元素,根据所述声学得分列表更新所述中心元素在混淆矩阵对应的行;所述混淆矩阵中每一行表征所述中心元素与所有的所述发音单元的混淆度;对所述混淆矩阵按行进行归一化,得到作为输出结果的所述混淆矩阵。
根据本发明的一些实施例,所述获取所述音频数据的每一帧的中心元素,包括:接收所述音频数据对应的对齐文件;从所述对齐文件中提取所述音频数据的每一帧的中心元素。
根据本发明的一些实施例,所述根据所述声学得分列表更新所述中心元素在混淆矩阵对应的行,包括:获取所述中心元素在混淆矩阵对应的行,作为第一行;确定所述声学得分列表中每个所述声学得分对应的所述发音单元,获取所述发音单元在所述混淆矩阵的所述第一行中对应的列作为第一列;根据所述声学得分对所述混淆矩阵的所述第一行的所述第一列的元素进行更新。
根据本发明的一些实施例,所述根据所述声学得分对所述混淆矩阵的所述第一行的所述第一列的元素进行更新,包括:所述混淆矩阵的所述第一行的所述第一列的元素累加所述声学得分。
根据本发明的一些实施例,所述对所述混淆矩阵按行进行归一化,得到作为输出结果的所述混淆矩阵,包括:对所述混淆矩阵的每一行进行求和,得到第一总和;将所述混淆矩阵中的每一行中的每一个元素,除以所述第一总和,得到归一化后的所述混淆矩阵作为所述输出结果。
根据本发明的一些实施例,所述方法包括:若归一化后的所述混淆矩阵中的任意元素小于第一阈值,则将所述任意元素配置为0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普强时代(珠海横琴)信息技术有限公司,未经普强时代(珠海横琴)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210136362.8/2.html,转载请声明来源钻瓜专利网。





