[发明专利]语音质检方法、装置、电子设备及介质有效
申请号: | 202110220938.4 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112951275B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 赵情恩;曾新贵;熊新雷;陈蓉;肖岩 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L15/26;H04M3/51;G06K9/62;G06F40/289;G06F40/216;G06F16/38;G06F16/35;G06F16/33 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 韩海花 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 质检 方法 装置 电子设备 介质 | ||
1.一种语音质检方法,包括:
获取待质检音频信息;
对所述待质检音频信息进行语音识别,得到所述待质检音频信息对应的多个文本段,并获取所述多个文本段分别对应的时间戳信息;其中,所述时间戳信息包括字粒度的时间戳信息和所述多个文本段分别对应的时间戳信息;
根据所述待质检音频信息和所述多个文本段对应的所述时间戳信息对所述待质检音频信息进行声纹聚类,以生成多个说话人的文本内容;
从所述多个说话人的文本内容之中获取目标说话人的文本内容;
对所述目标说话人的文本内容进行质检;
其中,所述根据所述待质检音频信息和所述多个文本段对应的所述时间戳信息对所述待质检音频信息进行声纹聚类,以生成多个说话人的文本内容,包括:
将所述待质检音频信息和所述多个文本段对应的所述时间戳信息输入声纹聚类模型,得到所述多个说话人的音频信息;
根据所述多个说话人的音频信息对所述多个文本段重新划分,以生成所述多个说话人的文本内容。
2.根据权利要求1所述的方法,其中,所述对所述待质检音频信息进行语音识别,得到所述待质检音频信息对应的多个文本段,包括:
采用经过训练的语音识别模型对所述待质检音频信息进行语音识别,以生成语音识别内容;
对所述语音识别内容进行断句,以生成多个文本段。
3.根据权利要求1所述的方法,其中,所述从所述多个说话人的文本内容之中获取目标说话人的文本内容,包括:
对所述多个说话人的文本内容进行识别,以确定各所述说话人的文本内容中包含的预设关键词的个数;
对各所述说话人的文本内容中包含的预设关键词的个数从大到小排序,将排序在前的所述说话人的文本内容作为所述目标说话人的文本内容。
4.根据权利要求3所述的方法,其中,所述确定各所述说话人的文本内容中包含的预设关键词的个数之后,还包括:
从各所述说话人的文本内容中确定所述预设关键词的个数大于个数阈值的目标说话人的文本内容。
5.根据权利要求1-4任一项所述的方法,其中,所述对所述目标说话人的文本内容进行质检,包括:
将所述目标说话人的文本内容输入经过训练的质检模型,以根据所述质检模型的输出确定质检结果;其中,所述质检模型是采用人工标注违规关键词的训练样本训练得到的。
6.一种语音质检装置,包括:
获取模块,用于获取待质检音频信息;
识别模块,用于对所述待质检音频信息进行语音识别,得到所述待质检音频信息对应的多个文本段,并获取所述多个文本段分别对应的时间戳信息;其中,所述时间戳信息包括字粒度的时间戳信息和所述多个文本段分别对应的时间戳信息;
生成模块,用于根据所述待质检音频信息和所述多个文本段对应的所述时间戳信息对所述待质检音频信息进行声纹聚类,以生成多个说话人的文本内容;
处理模块,用于从所述多个说话人的文本内容之中获取目标说话人的文本内容;
质检模块,用于对所述目标说话人的文本内容进行质检;
其中,所述生成模块,还用于:
将所述待质检音频信息和所述多个文本段对应的所述时间戳信息输入声纹聚类模型,得到所述多个说话人的音频信息;
根据所述多个说话人的音频信息对所述多个文本段重新划分,以生成所述多个说话人的文本内容。
7.根据权利要求6所述的装置,其中,所述识别模块,还用于:
采用经过训练的语音识别模型对所述待质检音频信息进行语音识别,以生成语音识别内容;
对所述语音识别内容进行断句,以生成多个文本段。
8.根据权利要求6所述的装置,其中,所述处理模块,还用于:
对所述多个说话人的文本内容进行识别,以确定各所述说话人的文本内容中包含的预设关键词的个数;
对各所述说话人的文本内容中包含的预设关键词的个数从大到小排序,将排序在前的所述说话人的文本内容作为所述目标说话人的文本内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110220938.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:三管式多联机空调机组的控制方法
- 下一篇:用于空调器的控制方法