[发明专利]基于实时语音情感分析的非法信息识别方法及装置有效
| 申请号: | 202110603389.9 | 申请日: | 2021-05-31 |
| 公开(公告)号: | CN113314103B | 公开(公告)日: | 2023-03-03 |
| 发明(设计)人: | 涂晴宇;倪晓平;林露丝;王玲亚 | 申请(专利权)人: | 中国工商银行股份有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;G10L25/27;G10L25/63 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 孙乳笋;周永君 |
| 地址: | 100140 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 实时 语音 情感 分析 非法 信息 识别 方法 装置 | ||
本发明提供了基于实时语音情感分析的非法信息识别方法及装置,方法包括:从获取的语音原始数据中提取情感特征;将提取的情感特征输入预先训练的鲁棒性情感分析模型中获得语音原始数据的可信度数值;根据可信度数值与预设的第一阈值和第二阈值的大小关系判断语音原始数据是否为非法信息。通过建立鲁棒性情感分析模型,对通话人的语音进行情感分析,对语音的可信度进行打分,如果打分超过预设值时,预设值可以为两道,当低于最低预设值时,可及时引导客户到柜台办理相关业务,通过银行柜员有效防止诈骗事实的发生,本申请对受诈可信度的不同分别提醒引导,能大大降低客户的实际受诈率,保证客户资金安全,提高银行专业可信度。
技术领域
本申请属于语音情感分析技术领域,具体地讲,涉及一种基于实时语音情感分析的非法信息识别方法及装置。
背景技术
随着互联网应用和通讯技术的迅速发展,普通个人客户的小额转账大多采用线上方式完成,但是大额转账业务目前仍是以柜台和ATM机办理为主。当前,有非法冒充银行客服电话引诱储户进行转账的诈骗行为,且大多数诈骗者会将受骗人引导至ATM自助转账设备进行转账操作以图躲过银行柜员对受骗人行为的警觉。因此,需要对非法信息进行识别来预防电信诈骗的发生。
发明内容
本申请基于实时语音情感分析的非法信息识别方法及装置,以至少解决当前在ATM机办理业务时因电信诈骗而遭受损失的问题。
根据本申请的第一个方面,提供了一种基于实时语音情感分析的非法信息识别方法,包括:
从获取的语音原始数据中提取情感特征;
将提取的情感特征输入预先训练的鲁棒性情感分析模型中获得语音原始数据的可信度数值;
根据可信度数值与预设的第一阈值和第二阈值的大小关系判断语音原始数据是否为非法信息。
在一实施例中,从获取的语音原始数据中提取情感特征,包括:
对获取的语音原始数据中的语音信号进行预加重;
对预加重后的语音信号进行分帧处理并提取每一帧的情感特征。
在一实施例中,根据可信度数值与预设的第一阈值和第二阈值的大小关系判断语音原始数据是否为非法信息,包括:
如果可信度数值高于第一阈值但小于第二阈值,则将语音原始数据划分为疑似非法信息并向用户发出提示;
如果可信度数值高于第二阈值,则终止后续业务流程并进行预警。
在一实施例中,鲁棒性情感分析模型的训练步骤包括:
提取标注后的历史语音数据中的情感特征;
将预先分类的情感类别与历史语音数据中的情感特征进行匹配生成情感类别与情感特征之间的映射关系;
根据映射关系建立多级网络模型;
通过多棵决策树构造随机森林语音识别算法,并利用标注后的历史语音数据对多级网络模型进行训练,获得鲁棒性情感分析模型。
在一实施例中,通过多棵决策树构造随机森林语音识别算法,并利用标注后的历史语音数据对多级网络模型进行训练,获得鲁棒性情感分析模型,包括:
计算多级网络模型中各个子节点的基尼系数;
根据各个子节点的基尼系数计算分裂的基尼系数;
根据分裂的基尼系数构建多颗输入样本不同的决策树,通过多颗决策树构建分类判断的随机森林;
利用随机森林及标注后的历史语音数据对多级网络模型进行训练,获得鲁棒性情感分析模型。
根据本申请的第二个方面,还提供了一种基于实时语音情感分析的非法信息识别装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110603389.9/2.html,转载请声明来源钻瓜专利网。





