[发明专利]验证声纹模型识别效果的方法、装置和计算机设备在审
申请号: | 202011485999.5 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112599137A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 王鑫;罗锐;张云婵 | 申请(专利权)人: | 康键信息技术(深圳)有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/04;G10L25/51 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 吴平 |
地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 验证 声纹 模型 识别 效果 方法 装置 计算机 设备 | ||
本申请涉及人工智能,具体公开了一种验证声纹模型识别效果的方法、装置、计算机设备和存储介质,通过调用声纹模型,根据验证数据集中各测试用户的注册音频和验证音频,对各测试用户分别进行至少两次声纹验证,得到测试识别成功率。一方面,用于验证声纹模型的数据源能够反应业务场景的人群分布,能够真实反应实际业务场景的使用情况,另一方面,在登录测试时进行至少两次登录验证,符合用户的使用意愿,从而采用该方法得到的声纹模型识别效果的验证结果能够真实反应实际业务场景的使用效果,排除了非模型因素导致的模型效果偏差,提高了验证精确度。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种验证声纹模型识别效果的方法、装置、计算机设备和存储介质。
背景技术
声纹具有获取方便,识别成本低等优点,因而声纹识别的应用越来越广。声纹识别就是把声信号转换成电信号,再用计算机进行识别。具体地,是利用神经网络训练出声纹模型,对声音进行识别。声纹模型的识别效果对于声纹的应用具有决定性的影响。
声纹模型在训练出来后,通常会进行验证,以评估是否能够上线应用。传统方案中,使用预先采集好的音频文件,使用每组中3个音频作为声纹注册音频,1个音频作为验证音频,来验证声纹的漏警率(同组中的音频是同一个人所录制,声纹识别的时候,应当判断为是本人,如果判断为非本人则计入漏警率),使用非本组的其他音频来验证虚警率(非同组中的音频是不同人所录制,声纹识别的时候,应当判断为是非本人,如果判断为本人则计入虚警率),基于这两个指标来验证声纹模型的准确性、可靠性。
该方法在进行验证时,仅考虑模型本身对声纹验证精确度的影响,在实际应用中还存在其它影响因素,例如不同的应用场景中人群分布存在差异,因而这种验证方法并没有考虑到非模型对声纹识别效果的影响,导致验证结果不精确。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高验证精确度的验证声纹模型识别效果的方法、装置、计算机设备和存储介质。
一种验证声纹模型识别效果的方法,所述方法包括:
获取验证数据集,所述验证数据集中测试用户的人群分布与业务场景相关,所述验证数据集包括所述测试用户的注册音频和验证音频,各测试用户分别至少具有两组验证音频;
调用声纹模型,根据所述验证数据集中各测试用户的注册音频和验证音频,对各测试用户分别进行至少两次声纹验证,得到测试识别成功率;
根据所述测试识别成功率,得到所述声纹模型识别效果的验证结果。
在其中一个实施例中,所述调用声纹模型,根据所述验证数据集中各测试用户的注册音频和验证音频,对各测试用户分别进行至少两次声纹验证,得到测试识别成功率,包括:
调用声纹模型,根据所述验证数据集中各测试用户的注册音频和验证音频,对各测试用户分别进行至少两次声纹验证,得到一次识别成功率、二次识别成功率和识别成功率;
对所述一次识别成功率、二次识别成功率和识别成功率进行加权求和,得到测试识别成功率;其中,所述一次识别成功率的权重大于所述二次识别成功率的权重以及所述识别成功率的权重。
在其中一个实施例中,所述获取验证数据集,包括:
获取业务场景的人群分布;
根据所述人群分布确定各性别和年龄阶段的测试用户的数量,得到目标测试用户;
采集各目标测试用户的至少三组注册音频和至少两组验证音频,得到验证数据集。
在其中一个实施例中,所述方法还包括:
根据实际业务场景下,验证音频正常的用户中识别成功的用户数量,得到正常音频情况下的业务识别成功率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康键信息技术(深圳)有限公司,未经康键信息技术(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011485999.5/2.html,转载请声明来源钻瓜专利网。