[发明专利]业务语音的质检方法、装置、设备及存储介质有效
| 申请号: | 202011476012.3 | 申请日: | 2020-12-15 |
| 公开(公告)号: | CN112634903B | 公开(公告)日: | 2023-09-29 |
| 发明(设计)人: | 石英伦 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/16;G10L15/02;G10L19/00 |
| 代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
| 地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 业务 语音 质检 方法 装置 设备 存储 介质 | ||
1.一种业务语音的质检方法,其特征在于,所述业务语音的质检方法包括:
获取业务语音数据,并利用编码器对所述业务语音数据进行编码,得到编码语音数据,计算所述编码语音数据与预置声明编码数据之间的基础相似度,根据所述基础相似度的数值在所述编码语音数据中筛选待检测声明语音编码数据;
基于语音识别算法将所述待检测声明语音编码数据转化为待检测声明文本,利用bert网络模型生成所述待检测声明文本的多个待检测声明句向量;
计算每个待检测声明句向量与标准声明句向量之间的基础相似概率值,将基础相似概率大于标准阈值所对应的待检测声明文本确定为目标待纠错文本;
利用模糊匹配算法对所述目标待纠错文本进行纠错,得到待判定文本,在所述待判定文本中筛查预置关键词,若所述待判定文本中存在所述预置关键词,则判定所述业务语音数据存在声明类风险语音数据;
通过意图识别算法生成所述业务语音数据对应的业务识别意图,判断所述业务识别意图中是否存在预置风险意图,若所述业务识别意图中存在预置风险意图,则判定所述业务语音数据存在语义类风险语音数据。
2.根据权利要求1所述的业务语音的质检方法,其特征在于,所述获取业务语音数据,并利用编码器对所述业务语音数据进行编码,得到编码语音数据,计算所述编码语音数据与预置声明编码数据之间的基础相似度,根据所述基础相似度的数值在所述编码语音数据中筛选待检测声明语音编码数据包括:
获取业务语音数据,利用奈奎斯特采样算法对所述业务语音数据进行采样,得到业务语音波形;
对所述业务语音波形进行量化处理,得到量化语音数据,将所述量化语音数据转化为数字脉冲,生成编码语音数据;
利用相似度算法计算所述编码语音数据与预置声明编码数据之间的相似度数值,得到基础相似度;
将数值最大的基础相似度所对应的编码语音数据确定为待检测声明语音编码数据。
3.根据权利要求1所述的业务语音的质检方法,其特征在于,所述基于语音识别算法将所述待检测声明语音编码数据转化为待检测声明文本,利用bert网络模型生成所述待检测声明文本的多个待检测声明句向量包括:
基于语音识别算法获取所述待检测声明语音编码数据对应的待检测业务语音数据,提取所述对应的待检测业务语音数据中的语音特征,根据所述语音特征匹配得到待检测声明文本;
利用bert网络模型生成所述待检测声明文本的多个待检测声明句向量。
4.根据权利要求3所述的业务语音的质检方法,其特征在于,所述基于语音识别算法获取所述待检测声明语音编码数据对应的待检测业务语音数据,提取所述对应的待检测业务语音数据中的语音特征,根据所述语音特征匹配得到待检测声明文本包括:
基于语音识别算法获取所述待检测声明语音编码数据对应的待检测业务语音数据,提取所述对应的待检测业务语音数据中的语音特征;
将所述语音特征转化为音素信息,其中,所述音素信息用于指示构成音节的最小语音单位;
在预置字典中匹配与所述音素信息相同的文字信息,得到待检测声明文本。
5.根据权利要求3所述的业务语音的质检方法,其特征在于,所述利用bert网络模型生成所述待检测声明文本的多个待检测声明句向量包括:
获取所述待检测声明文本的多个语句序列,在每个语句序列的初始位置添加预置标记字符,得到多个第一标记序列;
在相邻两个第一标记序列之间添加预置间隔字符,得到多个第二标记序列;
利用bert网络模型对所述多个第二标记序列进行训练,生成多个待检测声明句向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011476012.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种落料器滤网双重清洁装置
- 下一篇:数据链路检测系统、方法及装置





