[发明专利]语音机器人采用的人工录音的优化方法、装置及电子设备有效
申请号: | 202011193582.1 | 申请日: | 2020-10-30 |
公开(公告)号: | CN112017698B | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 李瑶;邹佳华 | 申请(专利权)人: | 北京淇瑀信息科技有限公司 |
主分类号: | G11B20/10 | 分类号: | G11B20/10;G11B27/031;G10L21/007;G10L21/01;G10L25/63 |
代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 乔东峰 |
地址: | 100012 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 机器人 采用 人工 录音 优化 方法 装置 电子设备 | ||
1.一种语音机器人采用的人工录音的优化方法,其特征在于,所述方法包括:
获取语音机器人的历史通话数据集,该历史通话数据集包括人工录音数据和通话效果数据;
提取所述历史通话数据集中的人工录音的音频数据参数,并量化所述通话效果数据,建立用于评测人工录音效果模型的训练数据集;
使用所述训练数据集训练人工录音效果模型,计算人工录音的优选音频数据参数;
接收待评测的人工录音,提取所述待评测的人工录音的音频数据参数;
将待评测的音频数据参数与所述优选音频数据参数进行比对,生成所述人工录音的优化策略。
2.根据权利要求1所述的方法,其特征在于,所述使用所述训练数据集训练人工录音效果模型,计算人工录音的优选音频数据参数包括:
根据人工录音的类型将所述训练数据集分为多个子训练数据集;
使用所述子训练数据集分别训练人工录音效果模型,计算不同类型的人工录音的优选音频数据参数;
其中,所述人工录音的类型包括:开场白录音、促动录音和挽回录音。
3.根据权利要求1所述的方法,其特征在于,所述将待评测的音频数据参数与所述优选音频数据参数进行比对,生成所述人工录音的优化策略包括:
对所述待评测的人工录音进行语义解析,确定所述待评测人工录音的类型;
将待评测的音频数据参数与所述待评测人工录音类型对应的优选音频数据参数进行比对,生成所述人工录音的优化策略。
4.根据权利要求2所述的方法,其特征在于,所述提取所述待评测的人工录音的音频数据参数之后,所述方法还包括:
显示所述待评测的人工录音的音频数据参数和所述音频数据参数的编辑项;
根据用户对所述编辑项的编辑操作修改所述待评测的人工录音;
提取并显示修改后所述待评测的人工录音的音频数据参数。
5.根据权利要求4所述的方法,其特征在于,所述编辑项包括:所述音频数据的波形和音轨,所述编辑操作包括:裁剪、插入、删除。
6.根据权利要求2所述的方法,其特征在于,所述方法还包括:
存储人工录音的样本音频单元;
获取当前待修改的录音信息对应的待修改样本音频单元;
根据所述待修改样本音频单元更新人工录音。
7.根据权利要求1所述的方法,其特征在于,所述音频数据参数包括情绪指标、语速和音量中的至少一种。
8.一种语音机器人采用的人工录音的优化装置,其特征在于,所述装置包括:
获取模块,用于获取语音机器人的历史通话数据集,该历史通话数据集包括人工录音数据和通话效果数据;
创建模块,用于提取所述历史通话数据集中的人工录音的音频数据参数,并量化所述通话效果数据,建立用于评测人工录音效果模型的训练数据集;
模型计算模块,用于使用所述训练数据集训练人工录音效果模型,计算人工录音的优选音频数据参数;
提取模块,用于接收待评测的人工录音,提取所述待评测的人工录音的音频数据参数;
生成模块,用于将待评测的音频数据参数与所述优选音频数据参数进行比对,生成所述人工录音的优化策略。
9.一种电子设备,包括:
处理器;以及
存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行根据权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,当所述一个或多个程序被处理器执行时,实现权利要求1-7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京淇瑀信息科技有限公司,未经北京淇瑀信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011193582.1/1.html,转载请声明来源钻瓜专利网。