[发明专利]语音处理方法、计算机可读存储介质、计算机程序和电子设备在审
申请号: | 201911379229.X | 申请日: | 2019-12-27 |
公开(公告)号: | CN111261155A | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 郑方;邬晓钧;向银杉;张慧;方亚南 | 申请(专利权)人: | 北京得意音通技术有限责任公司;贵州得意音通技术有限责任公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/02;G10L17/00;G10L17/02;G10L17/14;G06F40/30 |
代理公司: | 北京康达联禾知识产权代理事务所(普通合伙) 11461 | 代理人: | 罗延红 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 方法 计算机 可读 存储 介质 程序 电子设备 | ||
本发明实施例提供一种语音处理方法、计算机可读存储介质、计算机程序和电子设备。语音处理方法包括:获取包含身份标识数据说话人的语音数据;对语音数据进行语音识别以及语义分析,至少获得识别标识数据;对所识别标识数据进行扩展处理,获得说话人的扩展标识数据;将扩展标识数据与用户信息数据库中存有的用户身份标识数据进行标识匹配,获得匹配的数据记录;对语音数据进行特征提取,获取说话人的特征数据;将特征数据分别与匹配到的数据记录中的用户身份特征数据进行特征匹配,确定说话人的身份以及身份认证结果。由此,在进行身份认证时可控地扩大搜索范围,同时提高命中率。
技术领域
本发明实施例涉及信息处理技术,尤其涉及一种语音处理方法、计算机可读存储介质、计算机程序和电子设备。
背景技术
身份认证技术是在计算机网络中确认操作者身份的过程而产生的有效解决方法。对用户的身份认证基本方法分为三种,即基于信息密码的身份认证、基于信任物体的身份认证、基于生物特征的身份认证。其中,基于生物特征的身份认证是根据独一无二的身体特征来证明操作者身份,比如指纹、人脸等。
说话人识别是生物特征识别技术的一种,其理论基础是,每一个声音都具有独特的特征,通过该特征能将不同人的声音进行有效的区分。说话人识别技术通常用于说话人辨认和说话人确认等两种场景。
在当前的生物特征识别中,说话人身份确认技术仅成熟于1:1和小规模的情况下;人脸的辨认应用也仅取相似度前几位的候选,而指纹识别、人脸识别技术目前也仅成熟于1:1的场景下,同时还面临这各种各样的隐私及假冒的问题。在现有的说话人识别技术中对于说话人身份的辨认,由于集合大,导致识别速度慢、准确率低。
发明内容
本发明实施例的目的在于,提供一种语音处理方案,以使得能够在对海量用户集合进行说话人辨认中提高命中率。
根据本发明实施例的第一方面,提供一种语音处理方法,包括:获取说话人的语音数据,所述语音数据包含所述说话人的身份标识数据;对所述语音数据进行语音识别,获得相应的识别文本数据;对所述识别文本数据进行语义分析,至少获得识别标识数据;对所述识别标识数据进行扩展处理,获得所述说话人的扩展标识数据;将扩展标识数据与用户信息数据库中存有的用户身份标识数据进行标识匹配,获得匹配的数据记录,所述数据记录至少包括所述用户身份标识数据和用户身份特征数据;对所述语音数据进行特征提取,获取所述说话人的特征数据;将所述特征数据分别与匹配到的数据记录中的用户身份特征数据进行特征匹配,确定所述说话人的身份以及身份认证结果。
可选地,所述对所述识别标识数据进行扩展处理,获得所述说话人的扩展标识数据,包括:将所述识别标识数据的字符串中的字符替换为容易与所述字符混淆的替换字符,获得所述扩展标识数据;和/或,将所述识别标识数据的字符串中处于端侧的字符删除,获得所述扩展标识数据。
可选地,在对所述识别标识数据进行扩展处理,获得扩展标识数据之前,所述方法还包括:将所述识别标识数据与用户信息数据库中存有的用户身份标识数据进行标识匹配,获得匹配的数据记录;如果没有匹配得到数据记录,则执行对所述识别标识数据进行扩展处理,获得扩展标识数据的步骤;如果匹配得到数据记录,则执行对所述语音数据进行特征提取以及将所述特征数据分别与匹配到的数据记录中的用户身份特征数据进行特征匹配的处理。
可选地,所述语音数据还包含所述说话人的交易数据,所述对所述识别文本数据进行语义分析,至少获得识别标识数据,包括:对所述识别文本数据进行语义分析,获得识别标识数据和识别交易数据。
可选地,在将所述特征数据分别与匹配到的数据记录中的用户身份特征数据进行特征匹配,确定所述说话人的身份以及身份认证结果之后,所述方法还包括:根据所述识别交易数据,执行交易操作;提供所述交易操作的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京得意音通技术有限责任公司;贵州得意音通技术有限责任公司,未经北京得意音通技术有限责任公司;贵州得意音通技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911379229.X/2.html,转载请声明来源钻瓜专利网。