[发明专利]基于机器人识别的语音输出方法、装置、机器人及介质在审
| 申请号: | 201910683300.7 | 申请日: | 2019-07-26 |
| 公开(公告)号: | CN110610703A | 公开(公告)日: | 2019-12-24 |
| 发明(设计)人: | 严月强 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/24;G10L17/22;G10L17/26;G10L17/18;G10L17/02;G10L17/04;G06K9/00 |
| 代理公司: | 44334 深圳市赛恩倍吉知识产权代理有限公司 | 代理人: | 陈敬华;刘丽华 |
| 地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 群体类型 机器人 交互对象 目标语音 人脸区域 人脸特征 特征向量 形体特征 语音特征 图像 语音输出装置 输出语音 语音输出 智能化 预设 语音 输出 检测 | ||
本发明提供了一种基于机器人识别的语音输出方法,所述方法包括:获取交互对象的全身图像;检测所述全身图像中的人脸区域和形体区域;提取所述人脸区域中的人脸特征;提取所述形体区域中的形体特征;连接所述人脸特征及所述形体特征得到特征向量;将所述特征向量输入至预先训练好的群体类型‑语音特征模型中,得到所述交互对象所属的群体类型及对应所述群体类型的目标语音特征;根据所述目标语音特征输出预设语音。本发明还提供了一种基于机器人识别的语音输出装置、机器人及介质。本发明通过训练得到群体类型‑语音特征模型,能够根据交互对象所属的群体类型,有针对性的输出语音,能够提高机器人的智能化程度。
技术领域
本发明涉及智能客服领域,具体涉及一种基于机器人识别的语音输出方法、装置、机器人及介质。
背景技术
随着人工智能的发展,智能机器人应运而生,运用智能机器人的领域和场景也越来越多。然而,现有技术中的机器人,只设置了一种语音版本,即不管与机器人交互的对象为少年还是中年男人,机器人都使用一种单一的语音进行输出,无法针对不同的交互对象输出不同特征的语音,单一的语音输出显得呆板,缺乏趣味性,机器人的智能程度有待进一步提高。
因此,有必要提供一种新的语音输出方案,使得机器人能够针对不同的交互对象输出不同特征的语音。
发明内容
鉴于以上内容,有必要提出一种基于机器人识别的语音输出方法、装置、机器人及介质,通过训练得到群体类型-语音特征模型,能够根据交互对象所属的群体类型,有针对性的输出语音,提高了机器人的智能化程度,提升交互对象与机器人交互的趣味性。
本发明的第一方面提供一种基于机器人识别的语音输出方法,所述方法包括:
获取交互对象的全身图像;
检测所述全身图像中的人脸区域和形体区域;
提取所述人脸区域中的人脸特征;
提取所述形体区域中的形体特征;
连接所述人脸特征及所述形体特征得到特征向量;
将所述特征向量输入至预先训练好的群体类型-语音特征模型中,得到所述交互对象所属的群体类型及对应所述群体类型的目标语音特征;
根据所述目标语音特征输出预设语音。
优选的,所述根据所述目标语音特征输出预设语音包括:
按照所述目标语音特征中的音高、音量、音强、音色结合预设语音版本或者预设的肢体动作输出所述预设语音。
优选的,所述群体类型-语音特征模型的训练过程包括:
获取多个群体类型的多个用户的图像及每个群体类型关联的预设语音片段;
提取每个所述图像的形体特征及每个所述预设语音片段的第一语音特征;
将所述群体类型、所述形体特征和所述第一语音特征作为样本数据集;
将所述样本数据集划分为训练集和测试集;
输入所述训练集至预设神经网络中进行训练,得到群体类型-语音特征模型;
输入所述测试集至所述群体类型-语音特征模型中进行测试;
获取测试通过率;
当所述测试通过率大于预设通过率阈值,结束所述群体类型-语音特征模型的训练。
优选的,所述方法还包括:
每隔预设时间段更新所述每个群体类型关联的语音片段;
提取更新的语音片段的第二语音特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910683300.7/2.html,转载请声明来源钻瓜专利网。





