[发明专利]语音对话数据处理方法、装置、计算机设备及存储介质在审
申请号: | 202110218920.0 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112967725A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 申定潜 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/18;G10L17/22;G10L25/63;G06F16/33;G06F16/332;G06F40/35 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 对话 数据处理 方法 装置 计算机 设备 存储 介质 | ||
本申请实施例属于人工智能领域,涉及一种语音对话数据处理方法、装置、计算机设备及存储介质,方法包括:根据触发的语音对话数据处理指令,获取当前通话的通话语音信息以及当前通话中用户的用户标签;将通话语音信息和用户标签转换为带有权重的向量矩阵;将带有权重的向量矩阵输入情绪判定模型,得到机器对话情绪参数;根据机器对话情绪参数对预先录制好的标准对话语音进行语音调整,得到适配对话语音,其中,语音调整包括声学调整和语气词调整;基于适配对话语音进行人机对话。此外,本申请还涉及区块链技术,标准对话语音可存储于区块链中。本申请提高了人机语音对话交互的智能性。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种语音对话数据处理方法、装置、计算机设备及存储介质。
背景技术
随着计算机技术的发展,人工智能(Artificial Intelligence,AI)的应用越来越广泛。人机对话是人工智能领域中的重要一环,具有丰富的应用场景,例如,在催收领域,可以引入人工智能进行AI语音催收,可以减少人力成本。
然而,当前的人机对话技术缺少对语音数据的处理,机器语音都是使用固定的一套语音库。语音库通常是由专业播音员录制,语音追求的是字正腔圆、大方得体。然而这种语音库较为刻板,面对不同的用户对象和使用场景,显得千篇一律,使得用户体验较差,人机语音对话交互不够智能。
发明内容
本申请实施例的目的在于提出一种语音对话数据处理方法、装置、计算机设备及存储介质,以解决人机语音对话交互不够智能的问题。
为了解决上述技术问题,本申请实施例提供一种语音对话数据处理方法,采用了如下所述的技术方案:
根据触发的语音对话数据处理指令,获取当前通话的通话语音信息以及所述当前通话中用户的用户标签;
将所述通话语音信息和所述用户标签转换为带有权重的向量矩阵;
将所述带有权重的向量矩阵输入情绪判定模型,得到机器对话情绪参数;
根据所述机器对话情绪参数对预先录制好的标准对话语音进行语音调整,得到适配对话语音,其中,所述语音调整包括声学调整和语气词调整;
基于所述适配对话语音进行人机对话。
进一步的,所述根据触发的语音对话数据处理指令,获取当前通话的通话语音信息以及所述当前通话中用户的用户标签的步骤之前,还包括:
根据接收到的人机对话启动指令,获取所述人机对话启动指令中的用户标识;
获取所述用户标识所对应用户标签,并将所述用户标签转换为初始向量矩阵;
将所述初始向量矩阵输入情绪判定模型,得到初始对话情绪参数;
根据所述初始对话情绪参数对预先录制好的初始标准对话语音进行语音调整,得到初始适配对话语音;
基于所述初始适配对话语音进行人机对话,并对所述人机对话进行语音监听,得到当前通话的通话语音信息。
进一步的,所述根据接收到的人机对话启动指令,获取所述人机对话启动指令中的用户标识的步骤之前,还包括:
获取训练语料,所述训练语料包括用户标签、历史对话语料和对话情绪参数;
提取所述历史对话语料的语音特征参数;
给所述语音特征参数和所述用户标签进行权重分配,以生成带有权重的向量矩阵;
将所述带有权重的向量矩阵作为模型输入,将所述对话情绪参数作为模型输出,对初始情绪判定模型进行训练,得到情绪判定模型。
进一步的,所述根据接收到的人机对话启动指令,获取所述人机对话启动指令中的用户标识的步骤之前,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110218920.0/2.html,转载请声明来源钻瓜专利网。